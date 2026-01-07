Українська національна LLM (велика мовна модель) вийде в бета-тестування навесні 2026 року, повідомив у середу перший віцепрем'єр-міністр - міністр цифрової трансформації Михайло Федоров у Telegram, розповівши, на якому етапі розробка, пише УНН.

Національна LLM навесні вийде в бета-тестування. Місія України - увійти в топ-3 країни за розвитком штучного інтелекту у світі. Один з наймасштабніших кроків - запуск власної великої мовної моделі, яка навчена на унікальних українських даних - написав Федоров.

Хто розробляє національну LLM

"Розробка LLM потребує ресурсів, а в часи війни всі кошти повинні бути спрямовані на оборону. Тому технічним партнером проєкту став Київстар. Компанія фінансує розробку національної великої мовної моделі, а потім передасть її державі", - вказав віцепрем'єр.

З його слів, українську LLM навчатимуть на сімействі моделей Gemma від Google - нашого стратегічного партнера. "Це передові технології, які ми адаптуємо під українську мову та контекст", - вказав він.

"А якість розробки національної LLM тестуватиме група незалежних експертів з різних галузей, яка перевірятиме модель на: технічну якість; етичність та безпечність для користувачів; знання української мови; розуміння національного контексту", - повідомив Федоров.

На якому етапі розробка зараз

"Нині триває найважливіша частина роботи - збір даних для навчання LLM. Для високої якості інформації з інтернету недостатньо, тому працюємо з державними органами, медіа, університетами та іншими інституціями - це терабайти унікальних даних", - розповів Федоров.

Паралельно, з його слів, створюється "юридичний фреймворк, щоб відповідально працювати з даними, які нам надають для тренування моделі".

Також, повідомив він, "група експертів уже працює над створенням бенчмарків - тестів для мовної моделі, які допоможуть оцінювати й покращувати її якість". Це, пояснив віцепрем'єр, "дасть змогу тримати у фокусі ефективність та безпеку мовної моделі".

Коли чекати на запуск української LLM

У січні 2026-го вже матимемо: першу базу текстів для тренування LLM; покращений токенізатор - інструмент, який розділяє слова на елементи, щоб LLM обробляла мову швидше а продуктивніше; власні бенчмарки для оцінки якості. Навесні 2026 року плануємо запустити бета-тестування. А назву для української LLM оберуть самі українці - у січні розпочнемо голосування в "Дії". Зробимо Україну AI-first державою - підсумував Федоров.

Доповнення

Торік у березні при оголошенні про початок розробки Федоров заявляв, що запуск національної LLМ дасть старт масовому виробництву українських ШІ-інструментів. З його слів, тисячі ШІ-продуктів створені на базі LLM - віртуальні асистенти, як ChatGPT, генератори тексту, як Notion AI, інструменти для програмування, як GitHub Copilot.