Menu
  • Home
  • O nás
  • Projekty ▾
    • Výzkum
    • Detektor urážek
    • Český detektor emocí
    • Anglický detektor emocí
    • Veřejné mínění emocí
    • Startup Akademie
  • Kariéra
  • Kontakt
  • Kalendář
  • Blog
Skip to content

Nová výzva!

by Honza Tyl | Posted on 12. 9. 20183. 2. 2019

Nedávno proběhla na Kaggle (https://www.kaggle.com/c/jigsaw-toxic-comment-classificatio…) zajímavá soutěž sestavit detektor, který dokáže poznat urážky, jedovaté a obscénní výroky a podobně – Toxic Comment Classification Challenge.

Dozvěděl jsem se to pozdě, ale přece jsem napsal hlubokou neuronovou síť založenou na LTSM + FastTextu (úspěšnost algoritmu by v kaggle žebříčku stačila na zlatou medaili). Kolega z Alpha Industries přeložil trénovací dataset do češtiny (70 mega textu! ) a nasadil jí na Amazon server a můžete si jí nyní vyzkoušet zde: www.detector.alphai.cz

Algoritmus není dokonalý, přesto však funguje obstojně v češtině i angličtině.

Úkol pro vás – Dokážete najít větu, nebo klidně i delší text, který vyhodnotí algoritmus jakože, není vulgární (jedovatý), ale je urážlivý?

Post Views: 1 803
Datasety Strojové učení Studiumalgoritmus Alpha Industries Amazon Amazon server fastText kaggle LTSM Toxic Toxická slova

Related Posts

13 září, 2024

Nejnovější generace modelů – o1-preview

1 května, 2019

Umělá inteligence a Stopařův průvodce po Galaxii: „Jaká je základní otázka Života, Vesmíru a vůbec?“

20 října, 2017

Budoucnost Startup Akademie

Nejnovější příspěvky

  • Digi Dvojče Jana Tyla napsalo další článek
  • Článek s pomocí digitálního dvojčete Jana Tyla
  • Umění digitálního věku
  • Revoluce v programování – Claude Code
  • DigiHavel ve školách slaví úspěch u dětí

Archivy

Rubriky

Štítky

AI AI Awards algoritmus algoritmy Alphai Alpha Industries Amazon Andrew Ng BERT Chatbot DALL·E Deep Learning DigiHavel digitální filosof Digitální spisovatel Dita Malečková Elon Musk Facebook Google GPT-2 GPT-3 GPU Hyperprostor IBM Inovace Jan Tyl Matylda Microsoft Neuronová síť NEWSPARK NLP NVIDIA OpenAI podcast Přednáška RNN Robot soutěž startup strojové učení technologie TensorFlow Tomáš Sedláček umělá inteligence Český rozhlas
Copyright Alpha Industries – blog. All rights reserved. | Powered by WordPress & Writers Blogily Theme
Alpha Industries - blog
  • Home
  • O nás
  • Projekty
    • Výzkum
    • Detektor urážek
    • Český detektor emocí
    • Anglický detektor emocí
    • Veřejné mínění emocí
    • Startup Akademie
  • Kariéra
  • Kontakt
  • Kalendář
  • Blog