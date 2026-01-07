Украинская национальная LLM (большая языковая модель) выйдет в бета-тестирование весной 2026 года, сообщил в среду первый вице-премьер-министр - министр цифровой трансформации Михаил Федоров в Telegram, рассказав, на каком этапе разработка, пишет УНН.

Национальная LLM весной выйдет в бета-тестирование. Миссия Украины - войти в топ-3 страны по развитию искусственного интеллекта в мире. Один из самых масштабных шагов - запуск собственной большой языковой модели, которая обучена на уникальных украинских данных

"Разработка LLM требует ресурсов, а во время войны все средства должны быть направлены на оборону. Поэтому техническим партнером проекта стал Киевстар. Компания финансирует разработку национальной большой языковой модели, а затем передаст ее государству", - указал вице-премьер.

По его словам, украинскую LLM будут обучать на семействе моделей Gemma от Google - нашего стратегического партнера. "Это передовые технологии, которые мы адаптируем под украинский язык и контекст", - указал он.

"А качество разработки национальной LLM будет тестировать группа независимых экспертов из разных отраслей, которая будет проверять модель на: техническое качество; этичность и безопасность для пользователей; знание украинского языка; понимание национального контекста", - сообщил Федоров.

"Сейчас идет важнейшая часть работы - сбор данных для обучения LLM. Для высокого качества информации из интернета недостаточно, поэтому работаем с государственными органами, медиа, университетами и другими институтами - это терабайты уникальных данных", - рассказал Федоров.

Параллельно, по его словам, создается "юридический фреймворк, чтобы ответственно работать с данными, которые нам предоставляют для тренировки модели".

Также, сообщил он, "группа экспертов уже работает над созданием бенчмарков - тестов для языковой модели, которые помогут оценивать и улучшать ее качество". Это, пояснил вице-премьер, "позволит держать в фокусе эффективность и безопасность языковой модели".

В январе 2026-го уже будем иметь: первую базу текстов для тренировки LLM; улучшенный токенизатор - инструмент, который разделяет слова на элементы, чтобы LLM обрабатывала язык быстрее и продуктивнее; собственные бенчмарки для оценки качества. Весной 2026 года планируем запустить бета-тестирование. А название для украинской LLM выберут сами украинцы - в январе начнем голосование в "Дія". Сделаем Украину AI-first государством