Новости переводов
Москва,
ул. Барклая, 13, стр. 2
+7 495 504-71-35 с 9-30 до 17-30
info@flarus.ru | Заказать перевод


Презентация компании
Расчет стоимости перевода






BERT - языковая модель от Google

BERT — это нейронная сеть от Google, показавшая результаты на целом ряде задач. С помощью BERT можно создавать программы для обработки языка: отвечать на вопросы, заданные в произвольной форме, создавать чат-ботов, автоматические переводчики, анализировать текст и так далее. BERT — это в первую очередь языковая модель, а не чат-бот.

Philipp Konnov
06 Марта, 2023

машинное обучение, BERT

Google представила предобученные модели BERT, но как это обычно и бывает в Machine Learning, их надо дообучать. Самый простой вариант — составить словарь со всеми существующими словами, и присваивать номер слова в этом словаре. Например, если слово "собака" стоит в этом словаре на 1678 месте, то на вход нейросети для этого слова подаем число 1678.

Вот только в естественном языке при слове "собака" у человека всплывает сразу множество ассоциаций: "пушистая", "злая", "друг человека". Нельзя ли как-то закодировать эту особенность нашего мышления в представлении для нейросети? Оказывается, можно. Для этого достаточно так пересортировать номера слов, чтобы близкие по смыслу слова стояли рядом.

На практике, каждому слову назначают не одно число, а несколько — вектор, скажем, из 32 чисел. И расстояния измеряют как расстояния между точками, на которые указывают эти вектора в пространстве соответствующей размерности. Это позволяет сопоставлять одному слову сразу несколько близких по смыслу слов. Более того, с векторами можно производить арифметические операции. Классический пример: если из вектора, обозначающего слово "король", вычесть вектор "мужчина" и прибавить вектор для слова "женщина", то получится некий вектор-результат. И он чудесным образом будет соответствовать слову "королева".

Учитывая, что нейронные сети хорошо приспособлены для математических преобразований, видимо, это и обеспечивает такую высокую эффективность этого метода. Существует несколько способов представлять слова векторами, они постепенно эволюционировали. Об этом читайте в продолжении.

Поделиться:


Прислать свою статью Наиболее читаемые Архив
метки: #вектор #нейросети #машинное обучение #нейронная сеть #словарь #Google #BERT


12 популярных песен, переведенных на испанский язык 7598

Популярность многих песен временами достигает невероятных масштабов. Немудрено, что как следствие возникают различные каверы, миксы и другие версии, использующие успех оригинала. В частности нередко некоторые англоязычные песни переводят на не менее распространенный среди мирового населения испанский язык.


Лингвовикторина по загадкам разных народов

Каждый третий участник получит по почте сувенир от нашего бюро переводов.


Обучение чат-бота: новый вид языкового сервиса 984

В индустрии локализации существует обеспокоенность по поводу того, что искусственный интеллект сделает работу переводчиков ненужной.


BERT - языковая модель от Google (часть 2) 1582

Идея в основе BERT лежит очень простая: давайте на вход нейросети будем подавать фразы, в которых 15% слов заменим на [MASK], и обучим нейронную сеть предсказывать эти закрытые маской слова.




Универсальный переводчик - из мира научной фантастики 1621

Книги и фильмы часто становятся предвестниками будущего. Некоторые открытия описаны так точно, что можно подумать, будто у авторов была машина времени. Пример тому – универсальный переводчик.


Через десять лет мы сможем общаться с собаками 1541

Футуролог Уильям Хигэм отмечает, что спрос и технический прогресс приведут к созданию первых систем перевода такого типа.


Новый русско-татарский переводчик на основе нейросети 1402

25 октября состоялась презентация нового переводчика, который называется Tatsoft и переводит как с русского на татарский язык, так и наоборот.


Nokia And Microsoft Join Forces Against Google And Apple For Mobile Dominance 2656



Google выпустил многоязычный переводчик для iPhone 3115



Ученые получили возможность изучить эволюцию языков с помощью Google 2562

Ученые из Гарвардского университета совместно с специалистами компании Google провели совместные исследования эволюции языка и словесности за последние двести лет, проанализировав оцифрованные книги.



Показать еще



شركة ترجمة Бюро за преводи Бюро перакладаў 翻译社 Překladatelská kancelář Übersetzugsbüro Oversættelse bureau Translation and Proofreading Services Agencia de traducciones Käännöstoimisto Бюро переводов Фларус, Москва Agence de traduction მთარგმნელობითი ბიურო Γραφείο μεταφράσεων अनुवाद एजेंसी Prevodilacki biro Fordítóiroda Penerjemahan Biro Agenzia di Traduzioni 翻訳代理店 번역 회사 Аударма бюросы Орчуулгын товчоо Biuro tłumaczeń Agência de tradução Birou de traduceri Преводилачка агенција Prekladateľská agentúra Агентии тарҷумонӣ Tercüme Bürosu Бюро перекладів Văn phòng phiên dịch
Последний наш перевод:
"Коммерческое предложение / Commercial offer ", Маркетинг и реклама

метки перевода: развитие, экономика, материалы.

Переводы в работе: 106
Загрузка бюро: 65%

Поиск по сайту:



Слово "переводчик" вошло в первую пятерку самых популярных запросов в Google у пользователей Украины


Развитие лингвистики в будущем связано с компьютеризацией и интернетом


В Душанбе состоялась презентация электронного переводчика, работающего с русским и таджикским языками


В Хакасии стартовала международная конференция филологов


Оксфордский словарь больше не будет издаваться в бумажной версии


В библиотеку Google Books входят почти 130 млн.книг на пятистах языках мира


Австралийские гиды разговаривают с туристами на языке инопланетян


Подписка на рассылку
избранных новостей
(~1 раз в месяц)



Экспорт контента сайта на системе Liferay
Подготовка контента сайта для перевода на другой язык, локализации и создания языковой версии сайта. Процедура экспорта контента сайта, формат файлов экспорта. Стоимость перевода сайта.



Словарь русский-коми
Словарь русский-коми



Викторина по непереводимым терминам








Компания

О бюро переводов
Письменный перевод
Локализация сайтов
Редактирование
Вычитка носителем языка
Примеры переводов
Вакансии
Контакты



Бюро переводов Фларус
© 2001-2024

Проекты

Работа для переводчиков
Новости переводов
Поздравления с переводом
Разговорник
Глоссарии и словари
Шаблоны переводов
Выставки в Москве

Контакты

Россия, Москва,
ул. Барклая, 13, стр. 2
схема проезда

Телефон:
+7 495 504-71-35

Заказ: info@flarus.ru