Новости переводов
Москва,
ул. Барклая, 13, стр. 2
+7 925 504-71-35 с 9-30 до 17-30
info@flarus.ru | Заказать перевод


Презентация компании
Расчет стоимости перевода






BERT - языковая модель от Google

Редактор бюро переводов Фларус
Philipp Konnov

06 Марта, 2023
BERT — это нейронная сеть от Google, показавшая результаты на целом ряде задач. С помощью BERT можно создавать программы для обработки языка: отвечать на вопросы, заданные в произвольной форме, создавать чат-ботов, автоматические переводчики, анализировать текст и так далее. BERT — это в первую очередь языковая модель, а не чат-бот.


машинное обучение, BERT

Google представила предобученные модели BERT, но как это обычно и бывает в Machine Learning, их надо дообучать. Самый простой вариант — составить словарь со всеми существующими словами, и присваивать номер слова в этом словаре. Например, если слово "собака" стоит в этом словаре на 1678 месте, то на вход нейросети для этого слова подаем число 1678.

Вот только в естественном языке при слове "собака" у человека всплывает сразу множество ассоциаций: "пушистая", "злая", "друг человека". Нельзя ли как-то закодировать эту особенность нашего мышления в представлении для нейросети? Оказывается, можно. Для этого достаточно так пересортировать номера слов, чтобы близкие по смыслу слова стояли рядом.

На практике, каждому слову назначают не одно число, а несколько — вектор, скажем, из 32 чисел. И расстояния измеряют как расстояния между точками, на которые указывают эти вектора в пространстве соответствующей размерности. Это позволяет сопоставлять одному слову сразу несколько близких по смыслу слов. Более того, с векторами можно производить арифметические операции. Классический пример: если из вектора, обозначающего слово "король", вычесть вектор "мужчина" и прибавить вектор для слова "женщина", то получится некий вектор-результат. И он чудесным образом будет соответствовать слову "королева".

Учитывая, что нейронные сети хорошо приспособлены для математических преобразований, видимо, это и обеспечивает такую высокую эффективность этого метода. Существует несколько способов представлять слова векторами, они постепенно эволюционировали. Об этом читайте в продолжении.

Поделиться:


Прислать свою статью Наиболее читаемые Архив
метки: #вектор #нейросети #машинное обучение #нейронная сеть #словарь #Google #BERT

Что в китайском сленге означает набор цифр 521? 9644

Цифра дня.


Трудности перевода с китайского на русский: отсутствие точного эквивалента термина 1048

Китайский язык богат составными словами (из иероглифов) и контекстной зависимостью. Если стандартный словарь предлагает перевод, переводчик может опереться на прецедент. Но когда термина нет в лексикографических источниках, возникает ситуация "перевода без прецедента". Это особенно актуально для научно-технических текстов.


Попадем ли мы в замкнутый круг искусственного интеллекта 1373

Представьте ситуацию: студент получает задание, обращается к ИИ, сдает работу преподу, он проверяет её через нейросеть. Формально задание выполнено и проверено, но по сути произошла коллизия: два искусственных интеллекта пообщались друг с другом, используя людей как посредников. Эта ситуация становится всё более распространенной и создает проблемы в образовании.


"Китайская" лингвистическая викторина

Каждый третий участник получит по почте сувенир от нашего бюро переводов.


Почему сложно переводить технические тексты с английского на русский, если они были ранее переведены с китайского на английский 1361

Перевод технических текстов, проходящий через несколько языков, представляет собой сложную задачу. Возникает особая сложность, когда речь идет о многослойных переводах, например, когда технический текст сначала переведен с китайского на английский, а затем с английского на русский. Рассмотрим причины, почему такой процесс является непростым для переводчика.


Вакансия: Переводчик для тренировки узкоспециализированной нейросети 1584

К нам с запросом обратилась компания, занимающаяся разработкой и обучением нейросетевых моделей для различных коммерческих целей. В связи с этим мы решили опубликовать вакансию.


Универсальный переводчик - из мира научной фантастики 2188

Книги и фильмы часто становятся предвестниками будущего. Некоторые открытия описаны так точно, что можно подумать, будто у авторов была машина времени. Пример тому – универсальный переводчик.


Natural language processing (NLP) - что это такое? 1837

Способность компьютера распознавать значение человеческого разговора (или "естественного языка" - Natural language).


Google запускает переводчик иероглифов на базе искусственного интеллекта. 3419

Google запустила переводчик иероглифов, который использует машинное обучение для декорирования древнеегипетского языка.


Система Google Translate начала использовать искусственный интеллект в работе с тестами на русском языке 2500

Система автоматизированного перевода Google Translate начала использовать искусственный интеллект в работе с тестами на русском языке, написал в своем блоге ведущий разработчик системы перевода Google Барак Туровский.



Показать еще



Translation and Proofreading Services Бюро переводов Фларус, Москва
Последний наш перевод:
"Устройство сбора эксфолиативных клеток", Медицинский перевод

метки перевода: клеток, эксфолиативных.

Переводы в работе: 84
Загрузка бюро: 27%

Поиск по сайту:



Google займется переводами патентов на 28 языков Евросоюза


Вьетнамский "Яндекс"


Американские лингвисты выбрали словом 2010 года сокращение "app"


За последнее столетие словарный запас английского языка увеличился вдвое


Развитие лингвистики в будущем связано с компьютеризацией и интернетом


Русская Википедия взяла рубеж 600 тысяч словарных статей


Оксфордский словарь больше не будет издаваться в бумажной версии


Подписка на рассылку
избранных новостей
(~1 раз в месяц)



Информативный перевод
Что такое информативный перевод? Подвиды информативного перевода. Особенности и принципы работы переводчика с текстом. Стоимость перевода.



Глоссарий по металлообработке
Глоссарий по металлообработке



Викторина по заимствованиям








Компания

О бюро переводов
Письменный перевод
Локализация сайтов
Редактирование
Вычитка носителем языка
Примеры переводов
Вакансии
Контакты



Бюро переводов Фларус
© 2001-2026

Проекты

Работа для переводчиков
Новости переводов
Поздравления с переводом
Разговорник
Глоссарии и словари
Шаблоны переводов
Выставки в Москве

Контакты

Россия, Москва,
ул. Барклая, 13, стр. 2
схема проезда

Телефон:
+7 925 504-71-35

Заказ: info@flarus.ru