|
|
|
|
|
|
|
|
|
|
Лингвистическая алгебра: ученые представили семантические связи между словами в виде векторов |
|
|
Возможности, которые открыла перед учеными компьютерная лингвистика, резко изменили способы исследования и понимания языка. Ученые из Австралии, например, предприняли дерзкую затею: они попытались представить семантические связи между словами в виде математических векторов. И что же у них получилось? Рассмотрим подробнее результаты исследования.
Простейшим примером математического выражения семантических связей является следующее: "король" — "мужчина" + "женщина" = "королева". Другой подобный пример: "Париж" - "Франция" + "Польша" = "Варшава". Разность векторов "Париж" и "Франция" выводит на поверхность идею о столице, а столицей Польши является Варшава. Пока все логично, не так ли?
Группа ученых, возглавляемая профессором Тимоти Болдуином из Университета Мельбурна (Австралия), попыталась выяснить пределы применимости такого подхода к семантическим связям между словами. Для того, чтобы это понять они сравнили с помощью машинного анализа векторы разных слов, представляющих собой объект и его часть (например, "самолет" и "кабина пилота") или объект и связанное с ним действие (например, "охотиться" и "олень"). Оказалось, что векторные связи между такими словами довольно крепки. Однако при попадании в сравнение случайных слов, векторные результаты значительно ухудшались. Так, например, программа связала между собой пару "took" и "turn" по признаку "прошедшее время", хотя на самом деле эти слова между собой никак не связаны.
Ученые отмечают, что принцип анализа слов по контекстным векторам действительно применим для семантического анализа. Однако он плохо подходит для анализа "сырых" данных, в которых присутствует много шума, так как классификатор начинает обнаруживать связи там, где их нет.
Прославленный автор "Алисы в стране чудес" был необычайным фантазером и выдающимся изобретателем новых понятий и слов. Помимо своих чудесных произведений, при прочтении которых дети попадают в удивительный сказочный мир, он обогатил английский язык рядом новых необычных понятий. |
Этот глоссарий содержит базовые термины, относящиеся к компьютерам и сетям. Каждый термин включает описание. |
Сервис Google Translate переводит некоторые слова и фразы с украинского языка на русский весьма своеобразно. Так "Російська Федерація" переводится как "Мордор", а фамилия министра иностранных дел РФ Сергея Лаврова — как "грустная лошадка". В корпорации поясняют, что переводчик Google Translate работает автоматически, без участия людей. |
При переводе фраз стоит учитывать несколько понятий одного слова в языках и не ограничивать себя только словарным или машинным переводом. Иначе появляются вопиющие и не допустимые смысловые ошибки, которые могут полностью испортить как перевод, так и репутацию переводчику. |
Британский разработчик UK Data Explorer представил веб-приложение - интерактивную карту, которое позволяет переводить отдельные слова и словосочетания с английского на более 30 европейских языков и сравнить, насколько слова в этих языках похожи или отличаются друг от друга. |
Компания U-STAR работает над созданием синхронного переводчика для смартфонов Apple iPhone, который будет понимать 13 языков. |
Российская общественная организация жертв незаконных политических репрессий представила серию рекламных плакатов, которые, по мнению некоторых журналистов, на "понятном молодежи языке" рассказывают о сталинских репрессиях. |
В США появится первая школа, в которой будут обучать детей на русском языке. Школа создана усилиями пятерых бывших россиянок, проживающих в США, для того, чтобы дети выходцев из России не забывали родной язык.
|
Задумывались ли вы когда-нибудь, что информация, представленная в крупнейшей онлайн-энциклопедии Википедия различается в языковых разделах ввиду того, что она представлена с позиций разных культур, через призму истории и т.д.? Группа ученых из Северо-Западного университета (Иллиноис, США) под руководством Брента Хехта (Brent Hecht) создала уникальную программу Омнипедия, позволяющую просматривать статьи с одинаковой тематикой из 25 языковых разделов Википедии. |
Показать еще
|
|
|
|
| | | | | | | |
|
Последний наш перевод:
"Руководство по эксплуатации / User manual
", Технический перевод метки перевода:
Переводы в работе: 80 Загрузка бюро: 35% |
|
|
| | | |
| | |
| |
|