Новости переводов
Москва,
ул. Барклая, 13, стр. 2
+7 495 504-71-35 с 9-30 до 17-30
info@flarus.ru | Заказать перевод


Презентация компании
Расчет стоимости перевода






BERT - языковая модель от Google (часть 2)

Редактор бюро переводов Фларус
Philipp Konnov

07 Марта, 2023
Идея в основе BERT лежит очень простая: давайте на вход нейросети будем подавать фразы, в которых 15% слов заменим на [MASK], и обучим нейронную сеть предсказывать эти закрытые маской слова.


машинное обучение, BERT

Например, если подаем на вход нейросети фразу "Я пришел в [MASK] и купил [MASK]", она должна на выходе показать слова "магазин" и "молоко". Это упрощенный пример с официальной страницы BERT, на более длинных предложениях разброс возможных вариантов становится меньше, а ответ нейросети однозначнее.

А для того, чтобы нейросеть научилась понимать соотношения между разными предложениями, дополнительно обучим ее предсказывать, является ли вторая фраза логичным продолжением первой. Или это какая-то случайная фраза, не имеющая никакого отношения к первой.

Так, для двух предложений: "Я пошел в магазин." и "И купил там молоко.", нейросеть должна ответить, что это логично. А если вторая фраза будет "Карась небо Плутон", то должна ответить, что это предложение никак не связано с первым.

Обучив таким образом нейронную сеть на корпусе текстов из Wikipedia и сборнике книг BookCorpus в течении 4 дней, получили BERT.

Поделиться:




Прислать свою статью Наиболее читаемые Архив
метки: #Wikipedia #Google #обучение #модель #нейросети #нейросеть #BERT #машинное обучение

Международный конкурс перевода для студентов 4138

Переводчик должен быть как стекло, такое прозрачное, что его не видно. Николай Гоголь


Вакансия: Переводчик для тренировки узкоспециализированной нейросети 1275

К нам с запросом обратилась компания, занимающаяся разработкой и обучением нейросетевых моделей для различных коммерческих целей. В связи с этим мы решили опубликовать вакансию.


23 февраля Google отключил нейросеть Gemini 2404

Три недели назад Google запустил функцию создания изображений людей для диалогового приложения Gemini (ранее известного как Bard). Некоторые из созданных изображений оказались оскорбительны и Google временно приостановила создание изображений людей в Gemini.


"Итальянская" лингвовикторина

Каждый третий участник получит по почте сувенир от нашего бюро переводов.


BERT - языковая модель от Google 1443

BERT — это нейронная сеть от Google, показавшая результаты на целом ряде задач. С помощью BERT можно создавать программы для обработки языка: отвечать на вопросы, заданные в произвольной форме, создавать чат-ботов, автоматические переводчики, анализировать текст и так далее. BERT — это в первую очередь языковая модель, а не чат-бот.


Через десять лет мы сможем общаться с собаками 2047

Футуролог Уильям Хигэм отмечает, что спрос и технический прогресс приведут к созданию первых систем перевода такого типа.


Google, Wikipedia и Mozilla провели день интенсивного перевода на язык майя 3166

Крупнейшие интернет гиганты Google, Wikipedia и Mozilla провели провели день интенсивного перевода собственных платформ на язык майя, который находится на втором месте по распространенности у коренного населения Мексики.


Wikipedia столкнулась с проблемой оттока авторов 2868

Популярная интернет-энциклопедия Wikipedia столкнулась с серьезной проблемой, которая ставит под угрозу ее дальнейшее развитие. Проблема заключается в оттоке авторов-добровольцев, работающих над наполнением энциклопедии. Об этом рассказал основатель ресурса Джимми Уэльс (Jimmy Wales) на ежегодном мероприятии Wikimania.


Чехи плохо владеют иностранными языками 3229

По новейшим исследованиям 54% чехов за рубежом потерялись бы и не были бы способны попросить помощи. Удивительно то, что в такой же ситуации оказались бы 23% студентов вузов, которые занимались иностранным языком во время обучения. Таким образом, чехи по знаниям языков сильно отстают от остальных стран Европы.


Google Experiments With Dictionary And Allows To Filter Google Search Results By Reading Level 3003




Показать еще



شركة ترجمة Бюро за преводи Бюро перакладаў 翻译社 Překladatelská kancelář Übersetzugsbüro Oversættelse bureau Translation and Proofreading Services Agencia de traducciones Käännöstoimisto Бюро переводов Фларус, Москва Agence de traduction მთარგმნელობითი ბიურო Γραφείο μεταφράσεων अनुवाद एजेंसी Prevodilacki biro Fordítóiroda Penerjemahan Biro Agenzia di Traduzioni 翻訳代理店 번역 회사 Аударма бюросы Орчуулгын товчоо Biuro tłumaczeń Agência de tradução Birou de traduceri Преводилачка агенција Prekladateľská agentúra Агентии тарҷумонӣ Tercüme Bürosu Бюро перекладів Văn phòng phiên dịch
Последний наш перевод:
"Маркетинговые материалы / Marketing materials ", Юридический перевод

метки перевода:



Переводы в работе: 76
Загрузка бюро: 61%

Поиск по сайту:



Русские школы должны оставаться русскими


Таксистов в Москве обяжут пройти аттестацию на знание русского языка


В России появится собственный аналог Wikipedia


За последнее столетие словарный запас английского языка увеличился вдвое


В Крыму прошла международная лингвистическая конференция MegaLing 2010


Европа в поиске качественных переводчиков



Новые правила белорусской орфографии предусматривают написание слова "Президент" с заглавной буквы



Подписка на рассылку
избранных новостей
(~1 раз в месяц)



Ключевые конференции в переводческом бизнесе
Краткие описания конференций, важных для локализации и переводческих проектов.



На каких языках говорят в разных странах (глоссарий соответствий)
На каких языках говорят в разных странах (глоссарий соответствий)



"Румынская" лингвовикторина








Компания

О бюро переводов
Письменный перевод
Локализация сайтов
Редактирование
Вычитка носителем языка
Примеры переводов
Вакансии
Контакты



Бюро переводов Фларус
© 2001-2025

Проекты

Работа для переводчиков
Новости переводов
Поздравления с переводом
Разговорник
Глоссарии и словари
Шаблоны переводов
Выставки в Москве

Контакты

Россия, Москва,
ул. Барклая, 13, стр. 2
схема проезда

Телефон:
+7 495 504-71-35

Заказ: info@flarus.ru