|
|
|
|
|
|
|
|
|
|
Автоматический определитель языка "Guesser" |
|
|
Коллектив лингвистов и программистов бюро переводов "Flarus" разработал алгоритм автоматического определения языка текста, который является частью единого программного лингвистического комплекса бюро.
Автоматический определитель языка Guesser.ru позволяет по нескольким введенным словам определить язык текста.
Следует отметить, пока определитель текста работает в тестовом режиме, точность его работы сильно зависит от языка, особенностей грамматики и уникальности слов загруженного текста.
Мы постоянно пополняем базу данных терминов нашего глоссария, который одновременно является корпусом слов для автоматического определителя языка и надеемся, что качество распознавания языка текста будет со временем улучшаться.
Т.к. мы не обладаем серьезными ресурсами для создания корпуса текста по всем языкам, думаю, данный алгоритм определения языка текста пока сложно использовать для непосредственной его задачи, но не исключено, что он будет полезен в лингвистических исследованиях и других наших проектах, таких как "Работа для переводчиков" и "Глоссарии".
Кроме того, в лингвистический комплекс бюро переводов "Flarus" входит:
- Алгоритм вычисления корелляции корпусов двух текстов (степень похожести текстов между собой), который используется на нашем сайте-эксперименте по сравнению онлайн-переводчиков.
- База данных меток переводов, которая служит для определения тематики текста и поиска выполненных переводов в архиве бюро.
- Сборник шаблонов юридических документов на разных языках с переводом на русский язык.
- Классификация профилей переводов (отраслей, сфер деятельности) клиентов бюро и пересечения профилей с тематическими выборками текстов.
По случаю 220-й годовщины со дня рождения составителя "Толкового словаря живого великорусского языка" Владимира Даля "Яндекс" провел исследование о том, как русский язык изменился за последние сто лет. Специалисты сравнили записи в дневниках начала XX века из собрания Центра "Прожито" Европейского университета в Петербурге с текстами статей в "Яндекс.Дзене". |
У заказчиков переводов часто возникают вопросы о методах оценки стоимости перевода. Мы решили ответить на эти вопросы на нашем новостном сайте и привести ссылки на инструменты, которыми пользуется менеджер бюро для оценки стоимости перевода. |
В нашем бюро был разработан автоматический определитель языка Guesser. Если изначально он работал на базе глоссариев, которых за более чем 10 лет работы бюро переводов "Фларус" было создано очень много, то теперь алгоритм определителя основан на маркерах языка. |
1 апреля в Каире и Александрии стартовала студенческая олимпиада по русскому языку. Проверить свои знания "великого и могучего", а также побороться за главный приз — поездку в Москву — решили более 100 участников. |
Задумывались ли вы когда-либо о том, влияет ли шрифт, которым набран тот или иной текст, на восприятие его читателями. Журнал New Scientist опубликовал обзор исследований восприятия человеком типографских шрифтов, проведенных в разное время и в разных странах. |
Теперь сайт знаменитого российского заповедника, который находится на Камчатке, стал доступен иностранным пользователям. Разработчики запустили англоязычную версию официального интернет-ресурса заповедника. |
Компания связи "Ростелеком" и образовательный телеканал " English Club TV" запускают акцию, победитель которой сможет отправиться в Великобританию. |
Сайт Voscreen поможет узнать, насколько хорошо вы воспринимаете английскую устную речь. |
С включением нашего проекта в экспорт Яндекс-новостей, мы решили увеличить поток публикаций. И вот что из этого вышло... |
Показать еще
|
|
|
|
| | | | | | | |
|
Последний наш перевод:
"Судебное решение / Judgment
", Юридический перевод метки перевода: документация, информационный, номер, свидетельство.
Переводы в работе: 78 Загрузка бюро: 35% |
|
|
| | | |
| | |
| |
|