Menu
  • Home
  • O nás
  • Projekty ▾
    • Výzkum
    • Detektor urážek
    • Český detektor emocí
    • Anglický detektor emocí
    • Veřejné mínění emocí
    • Startup Akademie
  • Kariéra
  • Kontakt
  • Kalendář
  • Blog
Skip to content

Nová výzva!

by Honza Tyl | Posted on 12. 9. 20183. 2. 2019

Nedávno proběhla na Kaggle (https://www.kaggle.com/c/jigsaw-toxic-comment-classificatio…) zajímavá soutěž sestavit detektor, který dokáže poznat urážky, jedovaté a obscénní výroky a podobně – Toxic Comment Classification Challenge.

Dozvěděl jsem se to pozdě, ale přece jsem napsal hlubokou neuronovou síť založenou na LTSM + FastTextu (úspěšnost algoritmu by v kaggle žebříčku stačila na zlatou medaili). Kolega z Alpha Industries přeložil trénovací dataset do češtiny (70 mega textu! ) a nasadil jí na Amazon server a můžete si jí nyní vyzkoušet zde: www.detector.alphai.cz

Algoritmus není dokonalý, přesto však funguje obstojně v češtině i angličtině.

Úkol pro vás – Dokážete najít větu, nebo klidně i delší text, který vyhodnotí algoritmus jakože, není vulgární (jedovatý), ale je urážlivý?

Post Views: 1 456
Datasety Strojové učení Studiumalgoritmus Alpha Industries Amazon Amazon server fastText kaggle LTSM Toxic Toxická slova

Related Posts

28 prosince, 2017

TensorFlow Playground

10 listopadu, 2018

Už jste slyšeli o RPA (Robotic process automation)?

7 ledna, 2019

Certifikát – Applied Machine Learning For Healthcare

Nejnovější příspěvky

  • Vydán klíčový díl o umělé inteligenci na podcastu Deep Talks
  • DigiKomenský – Největší učitel všech dob v podobě Jana Amose Komenského – pro učení dětem i samoukům
  • Ukázka GPT-4
  • OpenAI představí nejnovější hluboké učení – GPT-4
  • Blíží se konec pracovních míst? Strach z umělé inteligence není na místě, má překvapivé využití

Archivy

Rubriky

Štítky

AI AI Awards algoritmus algoritmy Alphai Alpha Industries Amazon Andrew Ng BERT Chatbot DALL·E Data Science Deep Learning DigiHavel digitální filosof Digitální spisovatel Dita Malečková Elon Musk Facebook Gartner Google GPT-2 GPT-3 GPU IBM Jan Tyl Matylda Microsoft Neuronová síť NLP NVIDIA OpenAI podcast Posobota RNN Robot soutěž startup strojové učení TensorFlow Tomáš Sedláček umělá inteligence Český rozhlas ČVUT Čína
Copyright Alpha Industries – blog. All rights reserved. | Powered by WordPress & Writers Blogily Theme
Alpha Industries - blog
  • Home
  • O nás
  • Projekty
    • Výzkum
    • Detektor urážek
    • Český detektor emocí
    • Anglický detektor emocí
    • Veřejné mínění emocí
    • Startup Akademie
  • Kariéra
  • Kontakt
  • Kalendář
  • Blog