Машинный перевод не справился с пониманием больших текстов

Киев • УНН

6 сентября 2018, 03:33 • 88645 просмотра

КИЕВ. 6 сентября. УНН. Группа швейцарских и британских исследователей предложила новый метод экспертной оценки машинного перевода, который позволяет проверить, насколько полно перевод передает смысл оригинала, и насколько он правилен с точки зрения грамматики — причем не на уровне отдельных предложений, а на уровне целого текста. Оказалось, что машинный перевод с китайского на английский уступает человеческому переводу по обоим критериям, информирует УНН со ссылкой на arXiv.org.

Машинный перевод не справился с пониманием больших текстов

В последние годы разработчикам удалось добиться успехов в машинном переводе и во многом — благодаря использованию нейросетей, которые позволяют учитывать контекст переведенных слов. Два года назад “рекордно точный” машинный перевод на основе глубокого обучения представила Google.

Обычно системы машинного перевода перед запуском проверяются либо с помощью специальных алгоритмов, либо вручную людьми. Во втором случае проверка, пусть и происходит медленнее, позволяет оценить качество намного полнее. Тем не менее, даже такая проверка в основном проходит на уровне предложений, и значительно реже — текста, что может отразиться на связности целого текста и, как следствие, его понимании читателем.

Новый метод для оценки качества машинного перевода предложили ученые под руководством Самюэля Лойбли (Sameul Läubli) из Цюрихского университета. Их метод основа на оценке экспертами всего двух параметров: соответствия исходному тексту (adequacy) и плавности (fluency). Такая оценка сводится к выбору лучшего варианта перевода на основе двух вопросов: “Какой перевод лучше передает смысл исходного текста?” и “Какой перевод грамматически более правилен?”.

Для проверки своего метода ученые попросили 100 профессиональных переводчиков оценить фрагменты перевода с китайского на английский: часть из них была сделана переводчиками, а часть — с помощью машинного перевода. Исследователи выяснили, что по обоим параметрам тексты, переведенные людьми, превосходят машинный перевод.

Авторы таким образом показали, что методики оценки качества машинного перевода должны выйти на более обширный контекстный уровень: нескольких предложений или даже целых текстов.

Обычно для построения эффективных моделей машинного перевода требуется использование достаточно объемных параллельных корпусов — сборников текстов на языке-источнике и целевом языке. Недавно, однако, разработчики из Facebook научились обходиться без него: для этого они используют векторное представление слов и алгоритм, который оценивает грамматическую правильность переведенных фрагментов.

Напомним, власти Великобритании объявили о намерении провести испытания сети стандарта 5G на железной дороге. Во время испытаний планируется проверить возможности нового стандарта обеспечивать непрерывный высокоскоростной доступ к интернету на всем протяжении маршрута.

Украинские Национальные Новости

Новости Мира Технологии

Лето придет в Украину с дождями и жарой под 30°

Вызывает не менее 16 различных типов рака: терапевт о вреде курения

Украина "пропустит" выплату 665 миллионов долларов по госдолгу. В Минфине дали разъяснения

В центре Чернигова заметили смерч: эксперт предупреждает о возможном увеличении таких явлений летом

Коррупционный диссонанс в Раде: суд 2 июня продолжит рассмотрение дела обвиняемого во взяточничестве нардепа Кузьминых

Фото с Усиком и суд между клонами: кое-что о более мелких игроках рынка "серой" техники

Илон Маск уходит из Белого дома: чем запомнились 130 дней на посту советника Трампа

Как война повлияла на маленьких украинцев - интервью с главой Госслужбы по делам детей

Подготовка ко второму туру переговоров с рф в Стамбуле: что известно на данный момент

Ситуация в Сумской области: враг пытается наступать, есть определенная "серая зона", эвакуация проходит активно - ОВА

ВСУ показали уничтожение новейшего российского комплекса РЭБ "Борисоглебск-2" с 70-километрового расстояния

Удар КАБами россиян по Запорожской области: погибла 9-летняя девочка

россия удерживает в Средиземном море ракетоноситель - ВМС

Тепло и преимущественно без осадков: какой погодой порадует украинцев последний день весны

Атака россиян на Херсон: погиб 66-летний мужчина

“Золотая” должность под угрозой: Елена Дума уперлась в “кресло” главы АРМА и снова воюет из-за реформы

Ценности на свалке: мир в минусе на 91 млрд долларов из-за e-waste

Вместо подозрения - тишина: как расследование против главного юриста НБУ увязло в бездействии

Илон Маск уходит из Белого дома: чем запомнились 130 дней на посту советника Трампа

Как война повлияла на маленьких украинцев - интервью с главой Госслужбы по делам детейЭксклюзив

Денис Шмыгаль

Дональд Трамп

Владимир Зеленский

Руслан Кравченко

Борис Писториус

Украина

Соединенные Штаты

Германия

Киев

Китай

Айс-латте: пять вариантов холодного кофе, которые легко приготовить дома

"Том Круз напугал бы нас больше, чем Брэд Питт" - режиссер "Формулы-1" о выборе актера для фильма

Лето без рубашек: Джастин Бибер с сыном встречают теплые дни

"Playing God" с музыкой Nube получает право на участие в "Оскаре" после победы на Animayo

Хейли Бибер продала бренд Rhode за миллиард долларов

M1 Abrams

F-16 Fighting Falcon

Р-73

Рейс 17 Malaysia Airlines

Телеграмма

Машинный перевод не справился с пониманием больших текстов

Как война повлияла на маленьких украинцев - интервью с главой Госслужбы по делам детей
Эксклюзив