Первые пробные исследования представляли собой несколько переводов отдельно взятых отрывков текста, для которых уже существовал перевод, выполненный переводчиком-человеком. Имея на руках исходные тексты и их переводы (которые мы условно обозначили "эталонами"), мы стали переводить их всеми онлайн-переводчиками, которые могли найти в свободном и бесплатном доступе в интернете.
Таким образом мы получили около двухсот машинных переводов для 30-ти исходных текстов.
Анализ машинного перевода мы вели вручную, и эмпирически вывели несколько закономерностей (которые, впрочем, были уже давно известны и описаны, в том же интернете). Однако, повторим их:
1. Онлайн-переводчики допускают лексические ошибки, переводя сложные предложения и речевые обороты. Чаще всего, лексические ошибки встречаются при переводах в парах с русским языком (русский-английский, английский-русский).
2. Онлайн-переводчики неточно переводят термины, как специфические, так и распространенные, но имеющие несколько значений, выбор которых делается человеком по контексту, а онлайн-переводчиком - на основе статистических данных.
3. Электронные переводчики делают грамматические ошибки при автоматическом переводе падежей и постановки глаголов в нужное число, что объясняется различиями в грамматике языков.
Это недостатки онлайн-переводчиков. Но у них есть масса достоинств, которые тоже необходимо упомянуть.
1. Бесплатность или низкая стоимость перевода (при использовании платных онлайн-переводчиков или услуг редакторов для редактирования перевода).
2. Доступность услуг онлайн-переводчика (не болеет, не бывает занят, при простое - денег не просит, может бесплатно поехать с вами в командировку).
3. Высокая скорость перевода.
4. Условная конфиденциальность (для онлайн-переводчиков не гарантируется, но для установленных на компьютере электронных переводчиков - конфиденциальность гарантируется).
5. Интеграция онлайн-переводчиков в различные сервисы (перевод сайтов "на лету", контекстный перевод, к примеру, на терминале по продаже билетов на автобус в Пекине, "корявый" русский лучше правильного китайского).
Однако вместо того, чтобы учитывать преимущества и недостатки электронных переводчиков, многие "исследователи" приводят абсурдные машинные переводы и анализируют их. Приведем понравившуюся нам цитату с сайта (не помню какого) онлайн-переводчика - "подчас создается впечатление, что таким образом они борются с собственными комплексами и пытаются, в первую очередь, себе доказать, что они умнее компьютера. Подобные критики зачастую уподобляются известному персонажу анекдота, который подсунул ломик под бензопилу и был страшно горд, увидев плачевный результат."
Проводя исследования и анализ машинных переводов, мы решили подойти с позиции "нам нравятся онлайн-переводчики" и сделать честное сравнение онлайн-переводчиков по нескольким критериям.
Первый критерий - работа с различными языками, в частности - в паре с русским языком. Мы определили языковые пары для которых машинный перевод был особенно хорошо (в правильном смысле) и был совсем плох (утерян смысл текста). По этому критерию мы сравнивали онлайн-переводчики между собой (используя одну и туже языковую пару) и, фиксируя онлайн-переводчика, сравнивали результат его работы - переводы на разные языки. Результаты мы свели в единую таблицу. Они наглядно представлены и будут интересны широкой публике - от лингвистов до конечных пользователей онлайн-переводчиков.
Второй критерий - тема текста и машинного перевода. Понятно, что не все темы для онлайн-переводчика "по зубам". Этот эксперимент мы начали проводить с начала 2011 года и он, так сказать, еще проходит "обкатку". Если кратко (подробно алгоритм описан на сайте проекта), мы определяли тему перевода по содержанию текста, используя специальный алгоритм и вычисляли среднюю оценку машинных переводов по одинаковым темам. Таким образом, пронормировав оценки мы имели возможность сравнить "сложность тематик" между собой.
Не спорим, исследование не претендует на научное достижение, но статистика - вещь очень интересная. Собственно, этот интерес и двигал нами, когда мы создавали проект "Сравнение онлайн-переводчиков".
Предпосылками для создания проекта оказался следующий фактор: все больше потенциальных клиентов бюро переводов начинают пользоваться электронными и онлайн-переводчиками. И мы начали развивать новую тему: забросили несколько постов на переводческих форумах, где поделились своими впечатлениями о положении дел в области машинных переводов. Также, мы решили создать и предложить услугу вычитки и доработки машинного перевода (т.к. текста, переведенного с помощью онлайн-переводчика и предоставленного клиентом в бюро переводов для редактирования). Мы исходили из того, что даже хороший перевод, как правило, нуждается в редакторской правке и решили предложить эту специфическую услугу на рынке переводов. Если мы не можем повлиять на ситуацию, то можем включиться в процесс машинного перевода.
Проведя анализ машинных переводов, мы получили интересные результаты:
1. Онлайн-переводчики хорошо переводят тексты по финансовой, технической теме (однозначный перевод терминов).
2. Качество онлайн-перевод выше для родственных языков (в большей степени это касается грамматики).
3. Для переводов на русский язык мы бы выбрали ПРОМТ, на английский и немецкий - Google Translate.
4. Что касается художественных и литературных переводов, то в обозримом будущем онлайн-переводчик не сможет заменить человека.