Menu
  • Home
  • O nás
  • Projekty ▾
    • Výzkum
    • Detektor urážek
    • Český detektor emocí
    • Anglický detektor emocí
    • Veřejné mínění emocí
    • Startup Akademie
  • Kariéra
  • Kontakt
  • Kalendář
  • Blog
Skip to content

Nová výzva!

by Honza Tyl | Posted on 12. 9. 20183. 2. 2019

Nedávno proběhla na Kaggle (https://www.kaggle.com/c/jigsaw-toxic-comment-classificatio…) zajímavá soutěž sestavit detektor, který dokáže poznat urážky, jedovaté a obscénní výroky a podobně – Toxic Comment Classification Challenge.

Dozvěděl jsem se to pozdě, ale přece jsem napsal hlubokou neuronovou síť založenou na LTSM + FastTextu (úspěšnost algoritmu by v kaggle žebříčku stačila na zlatou medaili). Kolega z Alpha Industries přeložil trénovací dataset do češtiny (70 mega textu! ) a nasadil jí na Amazon server a můžete si jí nyní vyzkoušet zde: www.detector.alphai.cz

Algoritmus není dokonalý, přesto však funguje obstojně v češtině i angličtině.

Úkol pro vás – Dokážete najít větu, nebo klidně i delší text, který vyhodnotí algoritmus jakože, není vulgární (jedovatý), ale je urážlivý?

Post Views: 1 919
Datasety Strojové učení Studiumalgoritmus Alpha Industries Amazon Amazon server fastText kaggle LTSM Toxic Toxická slova

Related Posts

11 března, 2019

Top 5 online kurzů na strojové učení pro rok 2019

16 října, 2017

Test rychlosti GPU

15 března, 2023

Vydán klíčový díl o umělé inteligenci na podcastu Deep Talks

Nejnovější příspěvky

  • Digi Dvojče Jana Tyla napsalo další článek
  • Článek s pomocí digitálního dvojčete Jana Tyla
  • Umění digitálního věku
  • Revoluce v programování – Claude Code
  • DigiHavel ve školách slaví úspěch u dětí

Archivy

Rubriky

Štítky

AI AI Awards algoritmus algoritmy Alphai Alpha Industries Amazon Andrew Ng BERT Chatbot DALL·E Deep Learning DigiHavel digitální filosof Digitální spisovatel Dita Malečková Elon Musk Facebook Google GPT-2 GPT-3 GPU Hyperprostor IBM Inovace Jan Tyl Matylda Microsoft Neuronová síť NEWSPARK NLP NVIDIA OpenAI podcast Přednáška RNN Robot soutěž startup strojové učení technologie TensorFlow Tomáš Sedláček umělá inteligence Český rozhlas
Copyright Alpha Industries – blog. All rights reserved. | Powered by WordPress & Writers Blogily Theme
Alpha Industries - blog
  • Home
  • O nás
  • Projekty
    • Výzkum
    • Detektor urážek
    • Český detektor emocí
    • Anglický detektor emocí
    • Veřejné mínění emocí
    • Startup Akademie
  • Kariéra
  • Kontakt
  • Kalendář
  • Blog