Ключевая мысль в том, что качество перевода ИИ не является фиксированной величиной. Оно зависит от темы исходного текста или документа.
В сферах с обширными проверенными данными (новости, общие документы, бытовая лексика) модели демонстрируют относительно высокую надежность. Уровень достоверности может достигать 90% и выше. Однако даже здесь пользователя подстерегают "галлюцинации" — моменты, когда модель, уверенно дополняя недостающий контекст, искажает факты или добавляет несуществующие детали. Это происходит в 5–10% случаев. Но такие тексты это прощают.
Дальше - хуже. Когда задача усложняется до синтеза, интерпретации или анализа разрозненных данных, частота ошибок в переводе существенно возрастает. ИИ работает на вероятностных паттернах, а не на логике и начинает делать заключения, приближая долю недостоверного перевода к 50%. ИИ может буквально перевести идиому ("to kick the can down the road" как "пинать банку по дороге", потеряв смысл "откладывать проблему"), а затем на основе этого буквализма перевести весь абзац или текст неверно. Получится красивый, но бессмысленный перевод.
В узкоспециализированных областях (научные дисциплины, уникальные технологические процессы, тонкости юридических документов) ситуация становится критической. Перевод может быть практически полностью недостоверным. Ситуации, когда ошибки достигают 100% — не редкость, а закономерность, так как у модели просто нет достаточного количества данных для обучения в этой нише. ИИ начнёт подменять узкоспециальные термины более распространёнными, неправильно интерпретировать факты, процессы. Полученный текст будет выглядеть как технический, но специалист сразу распознает в нём абсурд.
Искусственный интеллект кардинально изменил подход к переводу, сделав его мгновенным и общедоступным. Однако чем сложнее, специализированнее текст, тем выше риск получить недостоверный перевод.
Если нужен перевод с повышенным уровне ответственности - это задача для бюро переводов или переводчика. Доверять машинному переводу, все-равно что доверять сложный диагноз алгоритму, который лишь угадывает ответ на основе миллиона прочитанных книг.


