Menu
  • Home
  • O nás
  • Projekty ▾
    • Výzkum
    • Detektor urážek
    • Český detektor emocí
    • Anglický detektor emocí
    • Veřejné mínění emocí
    • Startup Akademie
  • Kariéra
  • Kontakt
  • Kalendář
  • Blog
Skip to content

Unsupervised MT- Strojové učení bez učitele

by Honza Tyl | Posted on 18. 1. 20192. 2. 2019

Stále je to spíše koncept, u kterého jsou výsledky relativně slabé, ale jsem překvapen, že to vůbec funguje. Podívejme se na strojový překlad. Klasicky se dnes dělá strojový překlad tak, že máte velké množství paralelních vět (např. v češtině a angličtině tu samou větu “Miluji tě.“ = “I love you.“).

Minulý rok jsem zde publikoval své výsledky, jak jsem takto naučil počítač česky/anglicky za 15 minut. Bylo to klasické učení s učitelem. Při tréninku jsem síto řekl, co považuji za dobrý překlad.

Tento přístup je však jiný. V čem je tento přístup jiný? Nebudete krmit počítač paralelními větami, ale dvěma velkými monolingvními korpusy v každém jazyce. Celý trik je v tom, že v rámci tohoto algoritmu dochází k automatickému generování paralelních dat pomocí iterativního zpětného překladu.

Zdroje:
https://arxiv.org/pdf/1804.07755v2.pdf
https://arxiv.org/abs/1804.07755
http://ruder.io/10-exciting-ideas-of-2018-in-nlp/…
GIT: https://github.com/facebookresearch/UnsupervisedMT

Post Views: 1 004
Aplikace Datasety Experimenty Python Strojové učení Text a sekvence Učení bez učitele

Related Posts

15 ledna, 2018

Závěr trilogie o autoenkóderech aneb Genesis 2.0 – až po stvoření prvních lidí

9 února, 2018

Umělá inteligence v cestovním ruchu

11 dubna, 2022

Systém DALL·E. přichází ve své druhé značně vylepšené verzi!

Nejnovější příspěvky

  • Digi Dvojče Jana Tyla napsalo další článek
  • Článek s pomocí digitálního dvojčete Jana Tyla
  • Umění digitálního věku
  • Revoluce v programování – Claude Code
  • DigiHavel ve školách slaví úspěch u dětí

Archivy

Rubriky

Štítky

AI AI Awards algoritmus algoritmy Alphai Alpha Industries Amazon Andrew Ng BERT Chatbot DALL·E Deep Learning DigiHavel digitální filosof Digitální spisovatel Dita Malečková Elon Musk Facebook Google GPT-2 GPT-3 GPU Hyperprostor IBM Inovace Jan Tyl Matylda Microsoft Neuronová síť NEWSPARK NLP NVIDIA OpenAI podcast Přednáška RNN Robot soutěž startup strojové učení technologie TensorFlow Tomáš Sedláček umělá inteligence Český rozhlas
Copyright Alpha Industries – blog. All rights reserved. | Powered by WordPress & Writers Blogily Theme
Alpha Industries - blog
  • Home
  • O nás
  • Projekty
    • Výzkum
    • Detektor urážek
    • Český detektor emocí
    • Anglický detektor emocí
    • Veřejné mínění emocí
    • Startup Akademie
  • Kariéra
  • Kontakt
  • Kalendář
  • Blog