alibaba-vypustyla-qwen3-nove-simeistvo-shi-modelei-shcho-konkuruie-z-google-ta-openai

Alibaba випустила Qwen3: нове сімейство ШІ-моделей, що конкурує з Google та OpenAI

 • 6120 переглядiв

Китайська технологічна компанія Alibaba у понеділок випустила Qwen3, сімейство ШІ-моделей, які, за її словами, можуть зрівнятися з найкращими моделями, доступними від Google та OpenAI, а в деяких випадках і перевершити їх, пише УНН з посиланням на TechCrunch.

Деталі

Більшість моделей доступні або скоро будуть доступні для завантаження за "відкритою" ліцензією на платформі розробки ШІ Hugging Face і GitHub. Вони варіюються у розмірі від 0,6 млрд параметрів до 235 млрд параметрів. Параметри приблизно відповідають навичкам вирішення проблем моделі, а моделі з великою кількістю параметрів зазвичай працюють краще, ніж моделі з меншою кількістю параметрів.

Нарощування серій моделей китайського походження, таких як Qwen, збільшило тиск на американські лабораторії, такі як OpenAI, з метою надання більш ефективних ШІ-технологій. Вони також спонукали політиків запровадити обмеження, спрямовані на обмеження можливості китайських ШІ-компаній отримувати чіпи, необхідні для навчання моделей.

WSJ: китайська Huawei розробляє новий ШІ-чіп, прагнучи конкурувати з Nvidia28.04.25, 09:09 • [views_4149]

За словами Alibaba, моделі Qwen3 є "гібридними" моделями - їм може знадобитися час, щоб "міркувати" над складними проблемами або швидко відповідати на простіші запити. Міркування дозволяє моделям ефективно перевіряти факти, подібно до таких моделей, як o3 від OpenAI, але за рахунок вищої затримки.

"Ми безшовно інтегрували режими мислення та немислення, пропонуючи користувачам гнучкість в управлінні бюджетом мислення, - написала команда Qwen у повідомленні в блозі. - Ця конструкція дозволяє користувачам з більшою легкістю налаштовувати бюджети для конкретних завдань".

Деякі моделі також використовують архітектуру суміші експертів (MoE), яка може бути більш ефективною з точки зору обчислень для відповідей на запити. MoE розбиває завдання на підзавдання та делегує їх дрібнішим спеціалізованим "експертним" моделям.

Моделі Qwen3 підтримують 119 мов, заявила Alibaba, і були навчені на наборі даних майже з 36 трильйонів токенів. Токени - це необроблені біти даних, які обробляє модель; 1 мільйон токенів еквівалентний приблизно 750 000 слів. Компанія заявила, що Qwen3 навчався на поєднанні підручників, "пар запитань і відповідей", фрагментів коду, даних, згенерованих ШІ, та багато чому іншому.

Ці поліпшення, поряд з іншими, значно підвищили можливості Qwen3, порівняно з його попередником Qwen2, заявила Alibaba. Жодна з моделей Qwen3, схоже, не на голову вище за останні топові моделі, такі як o3 і o4-mini від OpenAI, але вони демонструють високі результати, зазначає вижання.

На Codeforces, платформі для змагань із програмування, найбільша модель Qwen3 – Qwen-3-235B-A22B – лише трохи перевершує o3-mini від OpenAI та Gemini 2.5 Pro від Google. Qwen-3-235B-A22B також перевершує o3-mini в останній версії AIME, складного математичного тесту, і BFCL, тесту для оцінки здатності моделі "розмірковувати" про проблеми.

Найбільша публічна модель Qwen3, Qwen3-32B, все ще конкурує з низкою власних та відкритих ШІ-моделей, включаючи R1 китайської ШІ-лабораторії DeepSeek. Qwen3-32B перевершує модель o1 від OpenAI в кількох тестах, включаючи бенчмарк кодування LiveCodeBench.

Alibaba заявила, що Qwen3 "перевершує" можливості виклику інструментів, а також дотримання інструкцій та копіювання певних форматів даних. Крім моделей для завантаження, Qwen3 доступна у хмарних провайдерів, включаючи Fireworks AI та Hyperbolic.

Тухін Шрівастава, співзасновник і генеральний директор хмарного хостингу AI Baseten, сказав, що Qwen3 - це ще одна точка в тренді відкритих моделей, що йдуть в ногу із закритими системами, такими як OpenAI.

"США подвоюють ставки на обмеження продажів чіпів до Китаю та закупівель з Китаю, але такі моделі, як Qwen 3, які є сучасними і відкритими [...], безсумнівно, будуть використовуватися всередині країни", - сказав він TechCrunch.

У Китаю прорив у галузі EUV для виробництва чіпів - SCMP29.04.25, 13:49 • [views_7168]

Популярні
Новини по темі
Український гімнаст Чепурний здобув “золото” Кубка світу

 • 5221 переглядiв

Оновлено дату початку тимчасової окупації Маріуполя

 • 5839 переглядiв