Menu
  • Home
  • O nás
  • Projekty ▾
    • Výzkum
    • Detektor urážek
    • Český detektor emocí
    • Anglický detektor emocí
    • Veřejné mínění emocí
    • Startup Akademie
  • Kariéra
  • Kontakt
  • Kalendář
  • Blog
Skip to content

Zkouším počítač naučit překládat z angličtiny do češtiny

by Honza Tyl | Posted on 1. 8. 20183. 2. 2019

Našel jsem vzorek asi 7000 vět, které jsou v obou jazycích. Řeknu mu, aby si je 100x prošel a snažil se slova pochopit. Ulehčím mu to a dát mu k dispozici slovník česko-český s 2.000.000 slovy z wikipedie (word embedding 300d).

Vytvořím model a spouštím trénink. Desktop dává najevo, že se hýbe – ozývá se větráček. Teplota na GPU roste z 36 na 40, 50, 52 stupňů celsia. Můj počítačový atlet je slyšet, ale jede jen z 33% svého maxima. Rozcvička. Naučit se anglicky je pro něj přece jen spíš rozcvička.

Spočítám si, že naučit se celý dataset a projít ho 100x mu bude trvat zhruba čtvrt hodiny. Během toho mi dochází, že by asi mnohem víc uvítal anglicko-anglický slovník, když překládá z angličtiny. Pozdě, už si to prošel 77x. I tak se to mrška naučil trénovací data s 99% přesností a na testovacích skládá zkoušku se stále skvělým výsledkem 68% dobře. Páni! Takovou hlavu na jazyky bych chtěl mít. Testuju ho pár příkladech – viz obrázek. První věty nic moc, ale pak se rozjel! Na to že se učí angličtinu 15 minut, dost slušné.

Zkusím mu dát ještě k ruce ten anglicko-anglický slovník se 100 rozměry. Výsledek? Přesnost na testovacích datech je asi 1% lepší. 3500 anglických a 9500 českých tvarů slov zvládá obstojně. Co říkáte?

Post Views: 1 224
Datasety Experimenty Strojové učení Text a sekvence

Related Posts

1 května, 2022

Pokračování digitálního malíř – DALL·E od Open AI – výtvarné i realistické umění 2

28 prosince, 2017

TensorFlow Playground

30 dubna, 2018

Chcete si procvičit mozkové závity v oblasti NLP?

Nejnovější příspěvky

  • Digi Dvojče Jana Tyla napsalo další článek
  • Článek s pomocí digitálního dvojčete Jana Tyla
  • Umění digitálního věku
  • Revoluce v programování – Claude Code
  • DigiHavel ve školách slaví úspěch u dětí

Archivy

Rubriky

Štítky

AI AI Awards algoritmus algoritmy Alphai Alpha Industries Amazon Andrew Ng BERT Chatbot DALL·E Deep Learning DigiHavel digitální filosof Digitální spisovatel Dita Malečková Elon Musk Facebook Google GPT-2 GPT-3 GPU Hyperprostor IBM Inovace Jan Tyl Matylda Microsoft Neuronová síť NEWSPARK NLP NVIDIA OpenAI podcast Přednáška RNN Robot soutěž startup strojové učení technologie TensorFlow Tomáš Sedláček umělá inteligence Český rozhlas
Copyright Alpha Industries – blog. All rights reserved. | Powered by WordPress & Writers Blogily Theme
Alpha Industries - blog
  • Home
  • O nás
  • Projekty
    • Výzkum
    • Detektor urážek
    • Český detektor emocí
    • Anglický detektor emocí
    • Veřejné mínění emocí
    • Startup Akademie
  • Kariéra
  • Kontakt
  • Kalendář
  • Blog