Перевод литературных текстов требует творчества. Переводчики часто сталкиваются с непереводимостью слов, метафорами или идиомами. Несмотря на повышение производительности перевода с использованием нейронного машинного перевода, художественные тексты по-прежнему сложная задача для машинного перевода.
Качество нейронного машинного перевода зависит от большого количества факторов - необходимо учитывать языковую пару, объем обучающих данных и тип текстов, которые необходимо перевести. Чем больше переводов модель выполняет для определенного языка, тем выше
качество окончательных переводов.
С годами популярность машинного перевода росла, и, как следствие, возникла необходимость исследовать и совершенствовать эту технологию. Сейчас есть
машинный перевод почти человеческого качества для различных тематик, исключая узкоспециализированные. Наш многолетний опыт работы в сфере переводов позволяет утверждать, что
литературный перевод пока остается недоступным для машины. Чтобы узнать, как далеко можно продвинуться с машинным переводом в области литературы, было проведено исследование в Каталонии и переведены с английского на
каталонский 12 романов.
Английский и каталонский языки, происходящие из разных семей, были выбраны для того, чтобы усложнить задачу. Каталонский язык является не самым популярным европейским языком, а это означает, что данные для обучения системы перевода доступны, но их не так много, как для английского языка.
Система машинного перевода была обучена 133 романам, переведенным с английского на каталонский, и 1000 книгам, написанным на каталонском языке. Переводы 12 книг были вручную ранжированы носителями каталонского языка, сравнивая человеческий перевод с машинным. Для 2 книг машина достигла качества, эквивалентного человеческому переводу примерно наполовину.