Новости переводов
Москва,
ул. Барклая, 13, стр. 2
+7 495 504-71-35 с 9-30 до 17-30
info@flarus.ru | Заказать перевод


Презентация компании
Расчет стоимости перевода






BERT - языковая модель от Google

BERT — это нейронная сеть от Google, показавшая результаты на целом ряде задач. С помощью BERT можно создавать программы для обработки языка: отвечать на вопросы, заданные в произвольной форме, создавать чат-ботов, автоматические переводчики, анализировать текст и так далее. BERT — это в первую очередь языковая модель, а не чат-бот.

Philipp Konnov
06 Марта, 2023

машинное обучение, BERT

Google представила предобученные модели BERT, но как это обычно и бывает в Machine Learning, их надо дообучать. Самый простой вариант — составить словарь со всеми существующими словами, и присваивать номер слова в этом словаре. Например, если слово "собака" стоит в этом словаре на 1678 месте, то на вход нейросети для этого слова подаем число 1678.

Вот только в естественном языке при слове "собака" у человека всплывает сразу множество ассоциаций: "пушистая", "злая", "друг человека". Нельзя ли как-то закодировать эту особенность нашего мышления в представлении для нейросети? Оказывается, можно. Для этого достаточно так пересортировать номера слов, чтобы близкие по смыслу слова стояли рядом.

На практике, каждому слову назначают не одно число, а несколько — вектор, скажем, из 32 чисел. И расстояния измеряют как расстояния между точками, на которые указывают эти вектора в пространстве соответствующей размерности. Это позволяет сопоставлять одному слову сразу несколько близких по смыслу слов. Более того, с векторами можно производить арифметические операции. Классический пример: если из вектора, обозначающего слово "король", вычесть вектор "мужчина" и прибавить вектор для слова "женщина", то получится некий вектор-результат. И он чудесным образом будет соответствовать слову "королева".

Учитывая, что нейронные сети хорошо приспособлены для математических преобразований, видимо, это и обеспечивает такую высокую эффективность этого метода. Существует несколько способов представлять слова векторами, они постепенно эволюционировали. Об этом читайте в продолжении.

Поделиться:


Прислать свою статью Наиболее читаемые Архив
метки: #вектор #нейросети #машинное обучение #нейронная сеть #словарь #Google #BERT


Происхождение слова «зомби» 9274

Вы любите пощекотать нервишки просмотром очередного фильма-ужасов? Возможно, вам будет интересно узнать лингвистические детали слова «зомби» - трупа без души, который вернулся к жизни в результате определенных магических манипуляций.


Лингвистическая викторина по языку африкаанс

Каждый третий участник получит по почте сувенир от нашего бюро переводов.


Дубляж с искусственным интеллектом 1513

Дубляж с использованием искусственного интеллекта использует алгоритмы и машинное обучение для перевода и локализации аудио- или видео-контента.


Обучение чат-бота: новый вид языкового сервиса 1006

В индустрии локализации существует обеспокоенность по поводу того, что искусственный интеллект сделает работу переводчиков ненужной.




BERT - языковая модель от Google (часть 2) 1589

Идея в основе BERT лежит очень простая: давайте на вход нейросети будем подавать фразы, в которых 15% слов заменим на [MASK], и обучим нейронную сеть предсказывать эти закрытые маской слова.


Через десять лет мы сможем общаться с собаками 1558

Футуролог Уильям Хигэм отмечает, что спрос и технический прогресс приведут к созданию первых систем перевода такого типа.


Система Google Translate начала использовать искусственный интеллект в работе с тестами на русском языке 1975

Система автоматизированного перевода Google Translate начала использовать искусственный интеллект в работе с тестами на русском языке, написал в своем блоге ведущий разработчик системы перевода Google Барак Туровский.


Яндекс открыл сервис бесплатного он-лайн перевода 3413

Российский поисковик Яндекс открыл сервис бесплатного он-лайн перевода текстов, в основе которого лежит собственная технология, разработанная компанией.


Nokia And Microsoft Join Forces Against Google And Apple For Mobile Dominance 2661



Google выпустил многоязычный переводчик для iPhone 3122




Показать еще



شركة ترجمة Бюро за преводи Бюро перакладаў 翻译社 Překladatelská kancelář Übersetzugsbüro Oversættelse bureau Translation and Proofreading Services Agencia de traducciones Käännöstoimisto Бюро переводов Фларус, Москва Agence de traduction მთარგმნელობითი ბიურო Γραφείο μεταφράσεων अनुवाद एजेंसी Prevodilacki biro Fordítóiroda Penerjemahan Biro Agenzia di Traduzioni 翻訳代理店 번역 회사 Аударма бюросы Орчуулгын товчоо Biuro tłumaczeń Agência de tradução Birou de traduceri Преводилачка агенција Prekladateľská agentúra Агентии тарҷумонӣ Tercüme Bürosu Бюро перекладів Văn phòng phiên dịch
Последний наш перевод:
"ТЕХНИЧЕСКОЕ ЗАДАНИЕ НА ПРОЕКТИРОВАНИЕ И ИЗГОТОВЛЕНИЕ ПРЕСС-ФОРМЫ / DESIGN SPECIFICATION FOR DESIGN AND MANUFACTURE OF DIE MOULD ", Технологии строительства

метки перевода:



Переводы в работе: 98
Загрузка бюро: 25%

Поиск по сайту:



Google Translate Adds Conversation Mode


Развитие лингвистики в будущем связано с компьютеризацией и интернетом


С 2011 года официальные словари включат некоторые термины интернет-сленга


В УрГУ прошел семинар, посвященный мастерству перевода


В библиотеку Google Books входят почти 130 млн.книг на пятистах языках мира


Австралийские гиды разговаривают с туристами на языке инопланетян


Сленг мобильных абонентов похож на язык алкоголиков


Подписка на рассылку
избранных новостей
(~1 раз в месяц)



Услуги редактирования PowerPoint презентаций
Особенности вычитки и редактирования презентации в формате pptx. Как отредактировать презентацию в режиме отображения правок?



Глоссарий терминов из документов для исправительных учреждений
Глоссарий терминов из документов для исправительных учреждений



Викторина на тему языковой статистики








Компания

О бюро переводов
Письменный перевод
Локализация сайтов
Редактирование
Вычитка носителем языка
Примеры переводов
Вакансии
Контакты



Бюро переводов Фларус
© 2001-2024

Проекты

Работа для переводчиков
Новости переводов
Поздравления с переводом
Разговорник
Глоссарии и словари
Шаблоны переводов
Выставки в Москве

Контакты

Россия, Москва,
ул. Барклая, 13, стр. 2
схема проезда

Телефон:
+7 495 504-71-35

Заказ: info@flarus.ru