English

Нейросети на WMT: машинный перевод соперничал с человеком

14 августа 2019

1 — 2 августа во Флоренции состоялась Четвертая конференция по машинному переводу WMT-2019, организованная Ассоциацией компьютерной лингвистики (ACL). В мероприятии приняли участие крупные международные разработчики, в том числе — компания PROMT.

Каждый год, в рамках Ассоциации компьютерной лингвистики, специалисты в области машинного перевода, представители коммерческих организаций и научно-исследовательских групп со всего мира соревнуются друг с другом. В течение определенного времени они тренируют свои системы на материалах, предоставленных в рамках соревнования. Как правило, это тексты ООН и новости. После тренировки участники делают тестовые переводы с помощью своих и систем и предоставляют их для экспертной и автоматической оценки.

В последние несколько лет участники конференции активно представляют системы перевода на основе нейронных сетей. В рамках конференции много говорили о том, что нейросетевые технологии демонстрируют беспрецедентный рост качества машинного перевода. В связи с этим организаторы и участники конференции задумались над обновлением метрик для оценки качества перевода и сравнения систем. Например, было предложено уйти от сравнения качества перевода на отдельных предложениях к сравнению качества перевода документов целиком.

Компанию PROMT на WMT-2019 с новой технологией PROMT Neural представлял Александр Молчанов, руководитель отдела статистического и нейросетевого перевода. Он принял участие в постерной сессии, пообщался с коллегами и организаторами мероприятия, познакомил присутствующих с разработками и исследованиями PROMT в области нейронных сетей.

«Сегодня качество перевода неспециализированных текстов с помощью нейронных сетей очень высокое», — отметил он, — «Основной вызов сейчас – это возможность обучать нейронную сеть на разных типах данных от заказчика: на специализированных корпусах параллельных текстов разного объема или глоссариях. Кроме того, важно уметь подбирать тематически релевантный материал, если у заказчика нет данных для обучения нейронных сетей».

Новости по теме
"Цифровая волна" накрывает агропромышленный комплекс
Беспилотный транспорт двинется по концепции
Платформа GM Smart System для «умных» рабочих пространств подтвердила «российское гражданство»