|
|
|
|
|
|
|
|
|
|
Автоматический определитель языка "Guesser" |
|
|
 Коллектив лингвистов и программистов бюро переводов "Flarus" разработал алгоритм автоматического определения языка текста, который является частью единого программного лингвистического комплекса бюро.
Автоматический определитель языка Guesser.ru позволяет по нескольким введенным словам определить язык текста.
Следует отметить, пока определитель текста работает в тестовом режиме, точность его работы сильно зависит от языка, особенностей грамматики и уникальности слов загруженного текста.
Мы постоянно пополняем базу данных терминов нашего глоссария, который одновременно является корпусом слов для автоматического определителя языка и надеемся, что качество распознавания языка текста будет со временем улучшаться.
Т.к. мы не обладаем серьезными ресурсами для создания корпуса текста по всем языкам, думаю, данный алгоритм определения языка текста пока сложно использовать для непосредственной его задачи, но не исключено, что он будет полезен в лингвистических исследованиях и других наших проектах, таких как "Работа для переводчиков" и "Глоссарии".
Кроме того, в лингвистический комплекс бюро переводов "Flarus" входит:
- Алгоритм вычисления корелляции корпусов двух текстов (степень похожести текстов между собой), который используется на нашем сайте-эксперименте по сравнению онлайн-переводчиков.
- База данных меток переводов, которая служит для определения тематики текста и поиска выполненных переводов в архиве бюро.
- Сборник шаблонов юридических документов на разных языках с переводом на русский язык.
- Классификация профилей переводов (отраслей, сфер деятельности) клиентов бюро и пересечения профилей с тематическими выборками текстов.
Китайский язык невероятно богат "ложными друзьями" переводчика, которые часто встречаются в повседневной разговорной речи. Без обогащения собственных знаний "ложными друзьями" можно не только оказаться в неловкой ситуации, но и серьезно обидеть вашего собеседника из Поднебесной. |
В целях усовершенствования системы образования в арабском регионе иорданская IT-компания разработала проект электронной библиотеки, которая будет иметь инновационные функции. Разработчики надеются, что электронная библиотека будет широко использоваться в арабских университетах и других образовательных учреждениях. |
Водитель из логистической компании FedEx в американском штате Юта лишился работы после того, как руководство компании обратило внимание на его русский акцент, уверяет пострадавший. |
Влияние интернета на язык огромно. Сначала блогосферы и социальные сети создают новые виды коммуникации, которые впоследствии и оказывают влияние на язык, считает директор Института лингвистики Российского государственного гуманитарного университета Максим Кронгауз. |
В отеле Hotel Indigo, который находится в британском городе Ньюкасл, бумажные экземпляры Библии заменили на электронные планшеты Kindle. Текст книги "залит" в память устройств. |
Сагу о Гарри Поттере и аудиокниги можно было легко найти в интернете и до сих пор. Однако все ссылки приводили к пиратским копиям. Отныне фанатам книги, написанной Джоан Роулинг, полная версия "поттерианы" на английском языке доступна на сайте Pottermore.com. |
По мнению британских исследователей, эмоциональное восприятие человеком слов напрямую зависит от расположения букв, составляющих эти слова, на клавиатуре. Так, "правые" слова оцениваются человеком как позитивные, в то время как "левые" в нашем сознании имеют более негативную окраску. |
Британские ученые из Университета Эксетера представили результаты эксперимента на капусте, доказывающего способность общаться у представителей растительного мира. |
Британская газета Guardian опубликовала для своих читателей тест, который должен выяснить, насколько хорошо жители Туманного Альбиона знакомы с русской литературой. |
Показать еще
|
|
|
|
|