Menu
  • Home
  • O nás
  • Projekty ▾
    • Výzkum
    • Detektor urážek
    • Český detektor emocí
    • Anglický detektor emocí
    • Veřejné mínění emocí
    • Startup Akademie
  • Kariéra
  • Kontakt
  • Kalendář
  • Blog
Skip to content

Nová výzva!

by Honza Tyl | Posted on 12. 9. 20183. 2. 2019

Nedávno proběhla na Kaggle (https://www.kaggle.com/c/jigsaw-toxic-comment-classificatio…) zajímavá soutěž sestavit detektor, který dokáže poznat urážky, jedovaté a obscénní výroky a podobně – Toxic Comment Classification Challenge.

Dozvěděl jsem se to pozdě, ale přece jsem napsal hlubokou neuronovou síť založenou na LTSM + FastTextu (úspěšnost algoritmu by v kaggle žebříčku stačila na zlatou medaili). Kolega z Alpha Industries přeložil trénovací dataset do češtiny (70 mega textu! ) a nasadil jí na Amazon server a můžete si jí nyní vyzkoušet zde: www.detector.alphai.cz

Algoritmus není dokonalý, přesto však funguje obstojně v češtině i angličtině.

Úkol pro vás – Dokážete najít větu, nebo klidně i delší text, který vyhodnotí algoritmus jakože, není vulgární (jedovatý), ale je urážlivý?

Post Views: 1 938
Datasety Strojové učení Studiumalgoritmus Alpha Industries Amazon Amazon server fastText kaggle LTSM Toxic Toxická slova

Related Posts

6 listopadu, 2017

Jak si píšete své poznámky?

18 ledna, 2019

Unsupervised MT- Strojové učení bez učitele

9 listopadu, 2021

HypeCycle pro AI 2021

Nejnovější příspěvky

  • Digi Dvojče Jana Tyla napsalo další článek
  • Článek s pomocí digitálního dvojčete Jana Tyla
  • Umění digitálního věku
  • Revoluce v programování – Claude Code
  • DigiHavel ve školách slaví úspěch u dětí

Archivy

Rubriky

Štítky

AI AI Awards algoritmus algoritmy Alphai Alpha Industries Amazon Andrew Ng BERT Chatbot DALL·E Deep Learning DigiHavel digitální filosof Digitální spisovatel Dita Malečková Elon Musk Facebook Google GPT-2 GPT-3 GPU Hyperprostor IBM Inovace Jan Tyl Matylda Microsoft Neuronová síť NEWSPARK NLP NVIDIA OpenAI podcast Přednáška RNN Robot soutěž startup strojové učení technologie TensorFlow Tomáš Sedláček umělá inteligence Český rozhlas
Copyright Alpha Industries – blog. All rights reserved. | Powered by WordPress & Writers Blogily Theme
Alpha Industries - blog
  • Home
  • O nás
  • Projekty
    • Výzkum
    • Detektor urážek
    • Český detektor emocí
    • Anglický detektor emocí
    • Veřejné mínění emocí
    • Startup Akademie
  • Kariéra
  • Kontakt
  • Kalendář
  • Blog