Menu
  • Home
  • O nás
  • Projekty ▾
    • Výzkum
    • Detektor urážek
    • Český detektor emocí
    • Anglický detektor emocí
    • Veřejné mínění emocí
    • Startup Akademie
  • Kariéra
  • Kontakt
  • Kalendář
  • Blog
Skip to content

Zkouším počítač naučit překládat z angličtiny do češtiny

by Honza Tyl | Posted on 1. 8. 20183. 2. 2019

Našel jsem vzorek asi 7000 vět, které jsou v obou jazycích. Řeknu mu, aby si je 100x prošel a snažil se slova pochopit. Ulehčím mu to a dát mu k dispozici slovník česko-český s 2.000.000 slovy z wikipedie (word embedding 300d).

Vytvořím model a spouštím trénink. Desktop dává najevo, že se hýbe – ozývá se větráček. Teplota na GPU roste z 36 na 40, 50, 52 stupňů celsia. Můj počítačový atlet je slyšet, ale jede jen z 33% svého maxima. Rozcvička. Naučit se anglicky je pro něj přece jen spíš rozcvička.

Spočítám si, že naučit se celý dataset a projít ho 100x mu bude trvat zhruba čtvrt hodiny. Během toho mi dochází, že by asi mnohem víc uvítal anglicko-anglický slovník, když překládá z angličtiny. Pozdě, už si to prošel 77x. I tak se to mrška naučil trénovací data s 99% přesností a na testovacích skládá zkoušku se stále skvělým výsledkem 68% dobře. Páni! Takovou hlavu na jazyky bych chtěl mít. Testuju ho pár příkladech – viz obrázek. První věty nic moc, ale pak se rozjel! Na to že se učí angličtinu 15 minut, dost slušné.

Zkusím mu dát ještě k ruce ten anglicko-anglický slovník se 100 rozměry. Výsledek? Přesnost na testovacích datech je asi 1% lepší. 3500 anglických a 9500 českých tvarů slov zvládá obstojně. Co říkáte?

Post Views: 974
Datasety Experimenty Strojové učení Text a sekvence

Related Posts

12 prosince, 2018

Víte, že AI Vánoce přišli o 12 dní dříve?

21 ledna, 2021

Digitální Karel Čapek – příběh druhý

14 ledna, 2019

Vyšla stručná příručka NLP

Nejnovější příspěvky

  • Vydán klíčový díl o umělé inteligenci na podcastu Deep Talks
  • DigiKomenský – Největší učitel všech dob v podobě Jana Amose Komenského – pro učení dětem i samoukům
  • Ukázka GPT-4
  • OpenAI představí nejnovější hluboké učení – GPT-4
  • Blíží se konec pracovních míst? Strach z umělé inteligence není na místě, má překvapivé využití

Archivy

Rubriky

Štítky

AI AI Awards algoritmus algoritmy Alphai Alpha Industries Amazon Andrew Ng BERT Chatbot DALL·E Data Science Deep Learning DigiHavel digitální filosof Digitální spisovatel Dita Malečková Elon Musk Facebook Gartner Google GPT-2 GPT-3 GPU IBM Jan Tyl Matylda Microsoft Neuronová síť NLP NVIDIA OpenAI podcast Posobota RNN Robot soutěž startup strojové učení TensorFlow Tomáš Sedláček umělá inteligence Český rozhlas ČVUT Čína
Copyright Alpha Industries – blog. All rights reserved. | Powered by WordPress & Writers Blogily Theme
Alpha Industries - blog
  • Home
  • O nás
  • Projekty
    • Výzkum
    • Detektor urážek
    • Český detektor emocí
    • Anglický detektor emocí
    • Veřejné mínění emocí
    • Startup Akademie
  • Kariéra
  • Kontakt
  • Kalendář
  • Blog