Машинный перевод не справился с пониманием больших текстов
Киев • УНН
КИЕВ. 6 сентября. УНН. Группа швейцарских и британских исследователей предложила новый метод экспертной оценки машинного перевода, который позволяет проверить, насколько полно перевод передает смысл оригинала, и насколько он правилен с точки зрения грамматики — причем не на уровне отдельных предложений, а на уровне целого текста. Оказалось, что машинный перевод с китайского на английский уступает человеческому переводу по обоим критериям, информирует УНН со ссылкой на arXiv.org.
В последние годы разработчикам удалось добиться успехов в машинном переводе и во многом — благодаря использованию нейросетей, которые позволяют учитывать контекст переведенных слов. Два года назад “рекордно точный” машинный перевод на основе глубокого обучения представила Google.
Обычно системы машинного перевода перед запуском проверяются либо с помощью специальных алгоритмов, либо вручную людьми. Во втором случае проверка, пусть и происходит медленнее, позволяет оценить качество намного полнее. Тем не менее, даже такая проверка в основном проходит на уровне предложений, и значительно реже — текста, что может отразиться на связности целого текста и, как следствие, его понимании читателем.
Новый метод для оценки качества машинного перевода предложили ученые под руководством Самюэля Лойбли (Sameul Läubli) из Цюрихского университета. Их метод основа на оценке экспертами всего двух параметров: соответствия исходному тексту (adequacy) и плавности (fluency). Такая оценка сводится к выбору лучшего варианта перевода на основе двух вопросов: “Какой перевод лучше передает смысл исходного текста?” и “Какой перевод грамматически более правилен?”.
Для проверки своего метода ученые попросили 100 профессиональных переводчиков оценить фрагменты перевода с китайского на английский: часть из них была сделана переводчиками, а часть — с помощью машинного перевода. Исследователи выяснили, что по обоим параметрам тексты, переведенные людьми, превосходят машинный перевод.
Авторы таким образом показали, что методики оценки качества машинного перевода должны выйти на более обширный контекстный уровень: нескольких предложений или даже целых текстов.
Обычно для построения эффективных моделей машинного перевода требуется использование достаточно объемных параллельных корпусов — сборников текстов на языке-источнике и целевом языке. Недавно, однако, разработчики из Facebook научились обходиться без него: для этого они используют векторное представление слов и алгоритм, который оценивает грамматическую правильность переведенных фрагментов.
Напомним, власти Великобритании объявили о намерении провести испытания сети стандарта 5G на железной дороге. Во время испытаний планируется проверить возможности нового стандарта обеспечивать непрерывный высокоскоростной доступ к интернету на всем протяжении маршрута.
Машинный перевод не справился с пониманием больших текстов
Противник Украины по Лиге наций разгромил Данию
ООС: боевики 31 раз нарушали режим прекращения огня
Канада не подпишет пересмотренное соглашение по NAFTA на невыгодных для себя условиях
США и ЕС обеспокоены давлением ГПУ на журналистку Радио "Свобода"
Украинский форвард оформил покер в матче Кубка Дании
Новый межкорейский саммит пройдет в Пхеньяне с 18 по 20 сентября
"Ворскла" усилилась двумя африканскими футболистами
Полиция представила доказательства вины президента Бразилии в коррупции
В Японии после землетрясения отключилось внешнее питание на одной из АЭС
Популярные
В результате удара по аэродрому "Бельбек "Украина могла повредить истребители МиГ-31 - Defense Express
Дело Укрзализныци: ВАКС обнаружил пробелы в привлечении нардепа Дубневича к уголовной ответственности
Утренним ударом рф повредило многоэтажку в Херсоне
Будут судить экс-замминистра, которого обвиняют во взятке в 400 тыс. долларов за заключение контрактов по завышенным ценам
Взрывы в Николаеве: глава ОГА заявил о двух попаданиях
Публикации
Дело Укрзализныци: ВАКС обнаружил пробелы в привлечении нардепа Дубневича к уголовной ответственности
Дело "Житло-Капитала": куда исчезли миллиарды?
Российский след видят только должники: как ярлык сотрудничества с рф используют в бизнес-войнах
Против и.о. замглавы ГНС Сокура открыто уголовное дело из-за препятствования обеспечению горючим армии
Кредитный лабиринт: как вернуть кредит, когда никто в этом не заинтересован и имеет совсем другие планы
Машинный перевод не справился с пониманием больших текстов
Группа швейцарских и британских исследователей предложила новый метод экспертной оценки машинного перевода, который позволяет проверить, насколько полно перевод передает смысл оригинала, и насколько он правилен с точки зрения грамматики — причем не на уровне отдельных предложений, а на уровне целого текста. Оказалось, что машинный перевод с китайского на английский уступает человеческому переводу по обоим критериям, информирует УНН со ссылкой на arXiv.org.
Противник Украины по Лиге наций разгромил Данию
В городе Трнава прошел товарищеский поединок футбольных национальных сборных Словакии и Дании, передает корреспондент УНН.
ООС: боевики 31 раз нарушали режим прекращения огня
За прошедшие сутки в районе проведения операции Объединенных сил боевики незаконных вооруженных формирований так называемых “Л/ДНР” 31 раз открывали огонь по позициям наших войск. Вооружение, запрещенное Минскими договоренностям, боевики при этом не применяли. При ведении боевых действий за прошедшие сутки один военнослужащий Объединенных сил погиб, еще трое получили ранения. Об этом сообщает УНН со ссылкой на пресс-центр Операции объединенных сил.
Канада не подпишет пересмотренное соглашение по NAFTA на невыгодных для себя условиях
Правительство Канады не будет подписывать с США пересмотренное соглашение о Североамериканской зоне свободной торговли (NAFTA) на невыгодных для себя условиях. Об этом премьер-министр Канады Джастин Трюдо заявил в Эдмонтоне (провинция Альберта) в эфире местной радиостанции CHED, передает УНН.
США и ЕС обеспокоены давлением ГПУ на журналистку Радио "Свобода"
Посольство США в Украине выразило обеспокоенность решением суда о предоставлении Генпрокуратуре доступа к информации с телефону журналистки, главного редактора программы “Схемы” Натальи Седлецкой, информирует УНН.
Украинский форвард оформил покер в матче Кубка Дании
Украинский форвард Юрий Яковенко продемонстрировал высокий уровень результативности в баталии 1/32 финала Кубка Дании, сообщает УНН со ссылкой на сайт ФК “Есьберг”.
Новый межкорейский саммит пройдет в Пхеньяне с 18 по 20 сентября
Третий межкорейский саммит пройдет с 18 по 20 сентября в Пхеньяне. Об этом заявил в четверг на брифинге в Сеуле Чон Ый Ён, специальный посланник президента Республики Корея Мун Чжэ Ина по итогам однодневного визита в Пхеньян, передает УНН со ссылкой на ТАСС.
"Ворскла" усилилась двумя африканскими футболистами
Участник группового этапа Лиги Европы УЕФА полтавская “Ворскла” объявила о подписании двух иностранных игроков. Об этом сообщает УНН со ссылкой на пресс-службу клуба.
Полиция представила доказательства вины президента Бразилии в коррупции
Полиция Бразилии отправила отчет в Федеральный Верховный суд страны, в котором содержатся доказательства получения бразильским президентом Мишелом Темером взяток от строительной компании Odebrecht. Об этом сообщает УНН со ссылкой на Associated Press.
В Японии после землетрясения отключилось внешнее питание на одной из АЭС
После землетрясения на японском острове Хоккайдо произошел сбой в работе основного источника энергии, который питает систему охлаждения бассейнов с использованным ядерным топливом на остановленной АЭС “Томари”. Об этом сообщает Kyodo со ссылкой на Управление по ядерному регулированию Японии, передает УНН.