Menu
  • Home
  • O nás
  • Projekty ▾
    • Výzkum
    • Detektor urážek
    • Český detektor emocí
    • Anglický detektor emocí
    • Veřejné mínění emocí
    • Startup Akademie
  • Kariéra
  • Kontakt
  • Kalendář
  • Blog
Skip to content

Společnost Google tento týden zveřejnila svou nejmodernější technologickou hračku – Bidirectional Encoder Representations Transformers neboli BERT

by Honza Tyl | Posted on 4. 11. 20183. 2. 2019

V čem se BERT liší klasických NLP modelů, jako jsou word2vec a GloVe? Word2vec a ostatní modely totiž generují bezkontextové vkládání slov. Každé slovo vyjádříte jako vektor (například 300 číslic, která matematicky reprezentují toto slovo).

BERT je jedinečný tím, že je obousměrný. To mu umožňuje přístup ke kontextu z minulých i budoucích směrů a bez učitele, což znamená, že může přijímat data, která nejsou ani klasifikována ani člověkem označena.
Zatímco bezkontextové modely mají pro slovo např. „oko“ jednu číselnou reprezentaci. BERT umí odlišit oko v hlavě, od oka na polévce či pytláckého oka. BERT bere v potaz kontext.

BERT se naučí modelovat vztahy mezi větami předtrénováním na úkol, který může být generován z libovolného korpusu, napsal Devlin a Chang. Vychází z platformy Google Transformer, architektury neuronových sítí s otevřeným zdrojovým kódem, založené na mechanismu self-focus, který je optimalizován pro NLP.

Při testování na datovém souboru Stanford Question Answering Dataset (SQuAD), datovém souboru s čtením, který obsahuje otázky týkající se souboru článků Wikipedie, dosáhla ERT 93,2% (což je skoro 2% lepší než doposud nejlepší algoritmy a I než člověk).

Originální článek: https://ai.googleblog.com/…/open-sourcing-bert-state-of-art…
Githab: https://github.com/google-research/bert
Autoři: Devlin, Jacob and Chang, Ming-Wei and Lee, Kenton and Toutanova, Kristina

Post Views: 783
Aplikace Učení bez učiteleBERT Bidirectional Encoder Representations Transformers GloVe Google Google Transformer Neuronová síť NLP self-focus SQuAD word2vec

Related Posts

9 září, 2020

…a ještě pár obrázků vygenerovaných z mé fotografie přes software od Rosebud AI

24 července, 2019

Cloudová neuronová síť WaveNet od Google už umí mluvit česky a slovensky!

8 října, 2018

V Česku se u voleb uplatnil robot. Pro ČTK psal zprávy

Nejnovější příspěvky

  • Umělá inteligence má emoce, bojí se, ráda s námi manipuluje. Začíná se AI chovat jako člověk?
  • Nedávno mě oslovila redaktorka Jana Divinová z Forbesu s velmi aktuální otázkou:…
  • Budeme tam s Leoš Kyša mluvit o AI a psaní knih. Taky jsou tam nějaký další divn…
  • Drazí přátelé. Zajímá vás jaký je smysl života a jak pokračuje AI závod? Včera j…
  • Už je to pět let co umělá inteligence umí napsat reportáž, takže to lidé nepoznají.

Archivy

Rubriky

Štítky

AI AI Awards algoritmus algoritmy Alphai Alpha Industries Amazon Andrew Ng BERT Chatbot DALL·E Deep Learning DigiHavel digitální filosof Digitální spisovatel Dita Malečková Elon Musk Facebook Google GPT-2 GPT-3 GPU Hyperprostor IBM Inovace Jan Tyl Matylda Microsoft Neuronová síť NEWSPARK NLP NVIDIA OpenAI podcast Přednáška RNN Robot soutěž startup strojové učení technologie TensorFlow Tomáš Sedláček umělá inteligence Český rozhlas
Copyright Alpha Industries – blog. All rights reserved. | Powered by WordPress & Writers Blogily Theme
Alpha Industries - blog
  • Home
  • O nás
  • Projekty
    • Výzkum
    • Detektor urážek
    • Český detektor emocí
    • Anglický detektor emocí
    • Veřejné mínění emocí
    • Startup Akademie
  • Kariéra
  • Kontakt
  • Kalendář
  • Blog