Новости переводов
Москва,
ул. Барклая, 13, стр. 2
+7 925 504-71-35 с 9-30 до 17-30
info@flarus.ru | Заказать перевод


Презентация компании
Расчет стоимости перевода






BERT - языковая модель от Google (часть 2)

Редактор бюро переводов Фларус
Philipp Konnov

07 Марта, 2023
Идея в основе BERT лежит очень простая: давайте на вход нейросети будем подавать фразы, в которых 15% слов заменим на [MASK], и обучим нейронную сеть предсказывать эти закрытые маской слова.


машинное обучение, BERT

Например, если подаем на вход нейросети фразу "Я пришел в [MASK] и купил [MASK]", она должна на выходе показать слова "магазин" и "молоко". Это упрощенный пример с официальной страницы BERT, на более длинных предложениях разброс возможных вариантов становится меньше, а ответ нейросети однозначнее.

А для того, чтобы нейросеть научилась понимать соотношения между разными предложениями, дополнительно обучим ее предсказывать, является ли вторая фраза логичным продолжением первой. Или это какая-то случайная фраза, не имеющая никакого отношения к первой.

Так, для двух предложений: "Я пошел в магазин." и "И купил там молоко.", нейросеть должна ответить, что это логично. А если вторая фраза будет "Карась небо Плутон", то должна ответить, что это предложение никак не связано с первым.

Обучив таким образом нейронную сеть на корпусе текстов из Wikipedia и сборнике книг BookCorpus в течении 4 дней, получили BERT.

Поделиться:


Прислать свою статью Наиболее читаемые Архив
метки: #Wikipedia #Google #обучение #модель #нейросети #нейросеть #BERT #машинное обучение

Что такое стиль цитирования OSCOLA? 2147

The Oxford University Standard for Citation of Legal Authorities (OSCOLA) — это руководство по стилю, которое обеспечивает современный метод юридического цитирования судебных дел, законопроектов, книг и журналов.


Кәсіби аударма қызметтері нарығы және жасанды интеллекттің заманауи жетістіктері 1100

Жасанды интеллект (AI) футуристік ұғым болудан қалып, күнделікті өмірдің ажырамас бөлігіне айналды. Медициналық диагностикалық жүйелерден жекелендірілген әлеуметтік медиа ұсыныстарына дейін AI технологиялары әлемді өзгертеді. Оның ықпалы ерекше байқалған саланың бірі аударма ісі болды. Дегенмен, АИ-нің қарқынды дамуы тек ынта ғана емес, сонымен қатар алаңдаушылық тудырады. Жаңа технологиялар қандай мүмкіндіктер ашады және аудармашыларға қандай қауіп төндіреді?


Популярные языки в письменных переводах за октябрь 2024 года 743

Статистика бюро переводов по наиболее популярным языкам и направлениям переводов за октябрь 2024 года. Европейские языки в России исчезли, остались азиатские и восточные.


Викторина на тему языковой статистики

Каждый третий участник получит по почте сувенир от нашего бюро переводов.


Обучение чат-бота: новый вид языкового сервиса 1766

В индустрии локализации существует обеспокоенность по поводу того, что искусственный интеллект сделает работу переводчиков ненужной.


Математики из Оксфорда научились определять авторство текста по знакам препинания 2398

Можно ли отличить роман Диккенса от Фолкнера или Хемингуэя от Теккерея, если убрать из книг все слова и оставить только знаки препинания? Оказывается, да.


Блокчейн (blockchain), криптовалюты, токены 2727

Сколько новых слов, в большинстве своем непонятных основной массе людей, появилось в модной технологии блокчейна (blockchain technology). Что это такое - новая технологическая революция или просто новый способ заработать, выдав "фишку" за технологию?


Facebook отключил нейросеть, создавшую собственный язык на основе английского 3128

Специалисты Facebook, работающие в лаборатории Facebook Artificial Intelligence Research Lab (FAIR), приняли решение об отключении нейронной сети, которая создала собственный язык на основе английского. Данное решение было вызвано ошибкой, которую специалисты обнаружили не сразу.


Автоконцерн Jaguar представил новую модель в виде "облака слов" 3089

Посетители Лондонского музея дизайна могут увидеть в эти дни необычную скульптуру, представляющую новую модель спортивного Jaguar XE в виде "облака слов".


"Википедию" переводят на ненецкий язык 3768

В Ненецком автономном округе работают над созданием специального раздела для ненецкого языка в популярной интернет-энциклопедии "Википедия".



Показать еще



Translation and Proofreading Services Бюро переводов Фларус, Москва
Последний наш перевод:
"Заверенный перевод чеков", Финансовая отчетность: чеки, квитанции

метки перевода: перевод, анталия, турция, заверенный.

Переводы в работе: 104
Загрузка бюро: 63%

Поиск по сайту:



Češi cizí jazyky příliš neovládají


Češi se mají naučit cizí řeči novou metodou SMS jazyky


Вьетнамский "Яндекс"


В Якутии издали первую азбуку на чукотском языке


Таксистов в Москве обяжут пройти аттестацию на знание русского языка


В Уфе переводчики двух последних выпусков крупнейшего ВУЗа не смогли найти работу по специальности


Профессия переводчика перспективна и востребована в Германии


Подписка на рассылку
избранных новостей
(~1 раз в месяц)



Перевод специализированных текстов по ветеринарии
Профессиональные переводы и вычитка (proofreading) носителем языка текстов по ветеринарии. Стоимость услуг.



Глоссарий по анатомической структуре лесоматериалов
Глоссарий по анатомической структуре лесоматериалов



Викторина по американскому школьному сленгу








Компания

О бюро переводов
Письменный перевод
Локализация сайтов
Редактирование
Вычитка носителем языка
Примеры переводов
Вакансии
Контакты



Бюро переводов Фларус
© 2001-2026

Проекты

Работа для переводчиков
Новости переводов
Поздравления с переводом
Разговорник
Глоссарии и словари
Шаблоны переводов
Выставки в Москве

Контакты

Россия, Москва,
ул. Барклая, 13, стр. 2
схема проезда

Телефон:
+7 925 504-71-35

Заказ: info@flarus.ru