Сервис машинного перевода Google Translate прошел за последнее десятилетие серьезный эволюционный путь, охватывая на сегодняшний день 103 языка и обрабатывая ежедневно свыше 140 млрд. слов. Для того, чтобы повысить качество работы сервиса, специалисты Google работают над новой технологией нейронного машинного перевода (GNMT, Google Network Machine Translation).
Технология была впервые анонсирована в сентябре этого года и о ее пробном запуске для восьми языков стало известно на прошлой неделе. Некоторый подробности ее работы раскрыты в статье «Google’s Multilingual Neural Machine Translation System: Enabling Zero-Shot Translation».
Технология позволяет одной системе осуществлять
перевод сразу между несколькими языками. Предложенная архитектура не требует внесения изменений в ядро GNMT, но включает дополнительный токен, вставляющийся в начало предложения. Этот токен определяет, на какой язык нужно осуществить перевод. Отдельно отмечается так называемый метод Zero-shot Translation, который позволяет
переводить отдельные фразы между языковыми парами, никогда ранее не встречающиеся.
Google демонстрирует это на примере
GNMT с поддержкой трёх языков. Допустим, система проходит обучение для четырёх пар — с японского на английский, с английского на японский, с корейского на
английский и с английского на корейский. В методе Zero-shot полученный опыт при переводе между этими парами используется для осуществления перевода тех же фраз между японским и корейским языками. По утверждению Google, такой тип обучения впервые использован в системах машинного перевода.