В Украине начали создание корпуса крымскотатарского языка: внесли уже более 700 материалов

В Украине начали создание корпуса крымскотатарского языка: внесли уже более 700 материалов

Киев  •  УНН

 • 579115 просмотра

КИЕВ. 27 марта. УНН. В рамках работы над Национальным корпусом крымскотатарского языка специалисты проработали более 700 материалов на крымскотатарском языке, разработали словарь лематизации для запуска модуля по поиску слов на онлайн-платформе. Об этом информирует УНН, ссылаясь на Telegram Минреинтеграции.

Детали

В рамках реализации Стратегии развития крымскотатарского языка на 2022-2032 годы Минреинтеграции инициировало создание Национального корпуса крымскотатарского языка (НККЯ), онлайн-платформы для исследования языка, которая будет работать на данных из текстовых материалов на крымскотатарском языке.

С октября 2022 года специалисты собрали печатные и электронные тексты на крымскотатарском языке для их дальнейшего импорта на платформу Sketch Engine. Отмечается, что за почти полгода они обработали и внесли в каталог более 700 материалов, среди которых произведения крымскотатарских авторов, журналы, газеты, учебники, документы международных организаций, субтитры фильмов и тому подобное.

Кроме этого, в рамках работы над НККМ разработали словарь лематизации.

"Имеется в виду создание реестра (базы данных) слов с обозначением их начальной формы и языковых характеристик (часть речи, род, число и т.д.). Это нужно для запуска модуля по поиску слов на онлайн-платформе Нацкорпуса. Разработка соответствующего программного обеспечения продолжается", - говорится в сообщении.

Проект реализуют при поддержке Минреинтеграции, швейцарско-украинской Программы EGAP, выполняемой Фондом Восточная Европа, и Киевского национального университета имени Тараса Шевченко.

Напомним

23 февраля 2022 года Кабинет министров Украины одобрил стратегию развития крымскотатарского языка на 2022-2032 годы и утвердил операционный план ее реализации.

В этом году, 6 января, правительство одобрило Комиссию по развитию крымскотатарского языка.