Нейросети на WMT: машинный перевод соперничал с человеком

14 August 2019

1 – 2 августа во Флоренции состоялась Четвертая конференция по машинному переводу WMT-2019, организованная Ассоциацией компьютерной лингвистики (ACL). В мероприятии приняли участие крупные международные разработчики, в том числе – компания PROMT.

Каждый год, в рамках Ассоциации компьютерной лингвистики, специалисты в области машинного перевода, представители коммерческих организаций и научно-исследовательских групп со всего мира соревнуются друг с другом. В течение определенного времени они тренируют свои системы на материалах, предоставленных в рамках соревнования. Как правило, это тексты ООН и новости. После тренировки участники делают тестовые переводы с помощью своих и систем и предоставляют их для экспертной и автоматической оценки.

В последние несколько лет участники конференции активно представляют системы перевода на основе нейронных сетей. В рамках конференции много говорили о том, что нейросетевые технологии демонстрируют беспрецедентный рост качества машинного перевода. В связи с этим организаторы и участники конференции задумались над обновлением метрик для оценки качества перевода и сравнения систем. Например, было предложено уйти от сравнения качества перевода на отдельных предложениях к сравнению качества перевода документов целиком.

Компанию PROMT на WMT-2019 с новой технологией PROMT Neural представлял Александр Молчанов, руководитель отдела статистического и нейросетевого перевода. Он принял участие в постерной сессии, пообщался с коллегами и организаторами мероприятия, познакомил присутствующих с разработками и исследованиями PROMT в области нейронных сетей.

«Сегодня качество перевода неспециализированных текстов с помощью нейронных сетей очень высокое», – отметил он, – «Основной вызов сейчас – это возможность обучать нейронную сеть на разных типах данных от заказчика: на специализированных корпусах параллельных текстов разного объема или глоссариях. Кроме того, важно уметь подбирать тематически релевантный материал, если у заказчика нет данных для обучения нейронных сетей».

Related news
Artezio Named Among 15 Leading Java Development Companies
Auriga Showcased Its Digital Health Projects at Healthcare Summit
SearchInform solution is now available in Microsoft Azure