English

Нейросети на WMT: машинный перевод соперничал с человеком

14 августа 2019

1 — 2 августа во Флоренции состоялась Четвертая конференция по машинному переводу WMT-2019, организованная Ассоциацией компьютерной лингвистики (ACL). В мероприятии приняли участие крупные международные разработчики, в том числе — компания PROMT.

Каждый год, в рамках Ассоциации компьютерной лингвистики, специалисты в области машинного перевода, представители коммерческих организаций и научно-исследовательских групп со всего мира соревнуются друг с другом. В течение определенного времени они тренируют свои системы на материалах, предоставленных в рамках соревнования. Как правило, это тексты ООН и новости. После тренировки участники делают тестовые переводы с помощью своих и систем и предоставляют их для экспертной и автоматической оценки.

В последние несколько лет участники конференции активно представляют системы перевода на основе нейронных сетей. В рамках конференции много говорили о том, что нейросетевые технологии демонстрируют беспрецедентный рост качества машинного перевода. В связи с этим организаторы и участники конференции задумались над обновлением метрик для оценки качества перевода и сравнения систем. Например, было предложено уйти от сравнения качества перевода на отдельных предложениях к сравнению качества перевода документов целиком.

Компанию PROMT на WMT-2019 с новой технологией PROMT Neural представлял Александр Молчанов, руководитель отдела статистического и нейросетевого перевода. Он принял участие в постерной сессии, пообщался с коллегами и организаторами мероприятия, познакомил присутствующих с разработками и исследованиями PROMT в области нейронных сетей.

«Сегодня качество перевода неспециализированных текстов с помощью нейронных сетей очень высокое», — отметил он, — «Основной вызов сейчас – это возможность обучать нейронную сеть на разных типах данных от заказчика: на специализированных корпусах параллельных текстов разного объема или глоссариях. Кроме того, важно уметь подбирать тематически релевантный материал, если у заказчика нет данных для обучения нейронных сетей».

Новости по теме
Институт системного программирования РАН и «Базис» расширяют работу по повышению безопасности российских облачных решений
«СёрчИнформ FileAuditor» поддержал классификацию файлов в облаках
Кибер Бэкап защищает данные ТК «Пермский», одного из крупнейших тепличных комплексов в России