Новости переводов
Москва,
ул. Барклая, 13, стр. 2
+7 925 504-71-35 с 9-30 до 17-30
info@flarus.ru | Заказать перевод


Презентация компании
Расчет стоимости перевода






BERT - языковая модель от Google (часть 2)

Редактор бюро переводов Фларус
Philipp Konnov

07 Марта, 2023
Идея в основе BERT лежит очень простая: давайте на вход нейросети будем подавать фразы, в которых 15% слов заменим на [MASK], и обучим нейронную сеть предсказывать эти закрытые маской слова.


машинное обучение, BERT

Например, если подаем на вход нейросети фразу "Я пришел в [MASK] и купил [MASK]", она должна на выходе показать слова "магазин" и "молоко". Это упрощенный пример с официальной страницы BERT, на более длинных предложениях разброс возможных вариантов становится меньше, а ответ нейросети однозначнее.

А для того, чтобы нейросеть научилась понимать соотношения между разными предложениями, дополнительно обучим ее предсказывать, является ли вторая фраза логичным продолжением первой. Или это какая-то случайная фраза, не имеющая никакого отношения к первой.

Так, для двух предложений: "Я пошел в магазин." и "И купил там молоко.", нейросеть должна ответить, что это логично. А если вторая фраза будет "Карась небо Плутон", то должна ответить, что это предложение никак не связано с первым.

Обучив таким образом нейронную сеть на корпусе текстов из Wikipedia и сборнике книг BookCorpus в течении 4 дней, получили BERT.

Поделиться:


Прислать свою статью Наиболее читаемые Архив
метки: #Wikipedia #Google #обучение #модель #нейросети #нейросеть #BERT #машинное обучение

Знаете ли вы, что ошибки произношения могут стоить жизни? Часть 3 4400

Заключительная часть.


Популярные языки в письменных переводах за октябрь 2024 года 873

Статистика бюро переводов по наиболее популярным языкам и направлениям переводов за октябрь 2024 года. Европейские языки в России исчезли, остались азиатские и восточные.


Вакансия: Переводчик для тренировки узкоспециализированной нейросети 1609

К нам с запросом обратилась компания, занимающаяся разработкой и обучением нейросетевых моделей для различных коммерческих целей. В связи с этим мы решили опубликовать вакансию.


Лингвистическая викторина по баскетбольным терминам

Каждый третий участник получит по почте сувенир от нашего бюро переводов.


BERT - языковая модель от Google 1649

BERT — это нейронная сеть от Google, показавшая результаты на целом ряде задач. С помощью BERT можно создавать программы для обработки языка: отвечать на вопросы, заданные в произвольной форме, создавать чат-ботов, автоматические переводчики, анализировать текст и так далее. BERT — это в первую очередь языковая модель, а не чат-бот.


Исскуственный интеллект: история, определения, глоссарий 3332

Исскуственный интеллект (ИИ) все больше и больше переплетается с нашим будущим, и по мере того, как язык ИИ проникает в разговоры, изучение специальной лексики ИИ может быть полезным для понимания многих ключевых технологических достижений.


Математики из Оксфорда научились определять авторство текста по знакам препинания 2473

Можно ли отличить роман Диккенса от Фолкнера или Хемингуэя от Теккерея, если убрать из книг все слова и оставить только знаки препинания? Оказывается, да.


Иорданская организация "Талял Абу-Газаля" создаст арабскую интернет-энциклопедию Tagepedia 3891

Палестинский предприниматель Талял Абу-Газаля инвестировал сумму 10 миллионов долларов США для создания арабской электронной интернет-энциклопедии с целью увеличения статей на арабском языке во всемирной сети интернет. Использование энциклопедии будет бесплатным для любых интернет-пользователей.


В Оксфорде создали языковую карту Википедии 3224

Исследователи из Оксфордского университета под руководством Марка Грэма составили карту языков крупнейшей в мире онлайн энциклопедии Википедия. Несомненно, самым распространенным языком статей энциклопедии стал английский.


Основатель Wikipedia Джимми Уэйлс прочитает в Москве бесплатную лекцию 2617

15 июня в Москве в кинотеатре "Пушкинский" (Пушкинская площадь, дом 2) состоится выступление основателя свободной энциклопедии Wikipedia Джимми Уэйлса (Jimmy Wales), которая начнется в 20:00 по московскому времени.



Показать еще



Translation and Proofreading Services Бюро переводов Фларус, Москва
Последний наш перевод:
"Перевод сайта отеля", Бизнес перевод

метки перевода: перевод, перевод сайта.

Переводы в работе: 80
Загрузка бюро: 27%

Поиск по сайту:



World Press Freedom Day


Google’s Technology To Translate Patents, Aid Researchers


"Сколково" ищет разработчиков виртуальных онлайн- и офлайн-переводчиков


Яндекс открыл сервис бесплатного он-лайн перевода


Google представил приложение, осуществляющее синхронный устный перевод


Wikipedia планирует расширить количество языков


Ученые получили возможность изучить эволюцию языков с помощью Google


Подписка на рассылку
избранных новостей
(~1 раз в месяц)



Информативный перевод
Что такое информативный перевод? Подвиды информативного перевода. Особенности и принципы работы переводчика с текстом. Стоимость перевода.



Глоссарий терминов по магнетизму
Глоссарий терминов по магнетизму



"Шведская" викторина по непереводимым терминам








Компания

О бюро переводов
Письменный перевод
Локализация сайтов
Редактирование
Вычитка носителем языка
Примеры переводов
Вакансии
Контакты



Бюро переводов Фларус
© 2001-2026

Проекты

Работа для переводчиков
Новости переводов
Поздравления с переводом
Разговорник
Глоссарии и словари
Шаблоны переводов
Выставки в Москве

Контакты

Россия, Москва,
ул. Барклая, 13, стр. 2
схема проезда

Телефон:
+7 925 504-71-35

Заказ: info@flarus.ru