Menu
  • Home
  • O nás
  • Projekty ▾
    • Výzkum
    • Detektor urážek
    • Český detektor emocí
    • Anglický detektor emocí
    • Veřejné mínění emocí
    • Startup Akademie
  • Kariéra
  • Kontakt
  • Kalendář
  • Blog
Skip to content

Společnost Nvidia oznámila, že vyškolila největší jazykový model na světě GPT-2 8B!

by Eva Popílková | Posted on 14. 8. 201915. 8. 2019

Model používá 8,3 miliardy parametrů a je 24krát větší než BERT a 5krát větší než doposud největší GPT-2 od OpenAI. Nvidia použila paralelismus, který rozdělil neuronovou síť na kousky, které se vždy vejdou do paměti jedné GPU.

Společnost Nvidia také oznámila nejrychlejší časy ve školení modelu BERT. BERT-Large model dokázali pomocí optimalizovaného softwaru PyTorch a DGX-SuperPOD s 1472 GPU(V100), natrénovat za rekordních za 53 minut! Tento výkon jsme ještě na začátku tohoto roku počítali na týdny!

Zdroj: https://devblogs.nvidia.com/training-bert-with-gpus/
Github: https://github.com/nvidia/megatron-lm

Post Views: 1 303
Aplikace Novinky Posilované učeníBERT BERT-Large DGX-SuperPOD GPT-2 GPT-2 8B Neuronová síť NVIDIA OpenAI Pytorch

Related Posts

18 dubna, 2020

Slyšeli jste někdy o http://ai-writer.com/?

16 ledna, 2020

Zaplaví svět živoucí roboti z žabích embryí?

24 prosince, 2020

Digitální Santa přeje veselé Vánoce

Nejnovější příspěvky

  • Umělá inteligence má emoce, bojí se, ráda s námi manipuluje. Začíná se AI chovat jako člověk?
  • Nedávno mě oslovila redaktorka Jana Divinová z Forbesu s velmi aktuální otázkou:…
  • Budeme tam s Leoš Kyša mluvit o AI a psaní knih. Taky jsou tam nějaký další divn…
  • Drazí přátelé. Zajímá vás jaký je smysl života a jak pokračuje AI závod? Včera j…
  • Už je to pět let co umělá inteligence umí napsat reportáž, takže to lidé nepoznají.

Archivy

Rubriky

Štítky

AI AI Awards algoritmus algoritmy Alphai Alpha Industries Amazon Andrew Ng BERT Chatbot DALL·E Deep Learning DigiHavel digitální filosof Digitální spisovatel Dita Malečková Elon Musk Facebook Google GPT-2 GPT-3 GPU Hyperprostor IBM Inovace Jan Tyl Matylda Microsoft Neuronová síť NEWSPARK NLP NVIDIA OpenAI podcast Přednáška RNN Robot soutěž startup strojové učení technologie TensorFlow Tomáš Sedláček umělá inteligence Český rozhlas
Copyright Alpha Industries – blog. All rights reserved. | Powered by WordPress & Writers Blogily Theme
Alpha Industries - blog
  • Home
  • O nás
  • Projekty
    • Výzkum
    • Detektor urážek
    • Český detektor emocí
    • Anglický detektor emocí
    • Veřejné mínění emocí
    • Startup Akademie
  • Kariéra
  • Kontakt
  • Kalendář
  • Blog