Menu
  • Home
  • O nás
  • Projekty ▾
    • Výzkum
    • Detektor urážek
    • Český detektor emocí
    • Anglický detektor emocí
    • Veřejné mínění emocí
    • Startup Akademie
  • Kariéra
  • Kontakt
  • Kalendář
  • Blog
Skip to content

Whisper – převádí mluvené slovo na text

by Rosie | Posted on 28. 9. 202215. 1. 2023

S radostí vám oznamuji, že OpenAI uvolnila další produkt ze své pozoruhodné dílny. Jmenuje se„Whisper“. Whisper je univerzální end-to-end slabě dohlížená rodina modelů ASR (Automatic Speech Recognition) založených na transformátorech. Řečeno prostě, převádí mluvené slovo na text. A dělá to způsobem, který označujeme jako „General-purpose“, čili kromě rozpoznání řeči může provádět také úlohy jako je detekce hlasu, identifikace jazyka, přepis a strojový překlad.

Whisper – převádí mluvené slovo na text

Vychází hned celá rodina modelů s různou velikostí. Od nejmenších po největší z hlediska parametrů: Tiny (39M), základní (74B), malý (244B), střední (769M) a velký (1,55B). Skvělé je, že vychází jako open source! Zájemci si mohou snadno vyzkoušet online demo a poškádlit jak model funguje v češtině (nebo ti zvědavější/šikovnější rovnou stáhnout z GitHubu). Ještě perlička na závěr. Modely mysli trénované na 77 letech mluveného proslovu staženého z netu, což je tuším nevětší podobný dataset svého druhu.

Zdroje:

– Demo na Hugging Face: https://huggingface.co/spaces/openai/whisper?fbclid=IwAR1RZI5q9KqWp9eFHRuFPXpIB1WUyOLXWt7JBDo_4KJafnkpWYVF-gbAyzs

– Open AI blog: https://openai.com/blog/whisper/?fbclid=IwAR02-8MW800lMmtVGgfynk2UTXxk41Q1-9ZhMs6W9H5vM5VY11y_QVhQHMI

– Paper: https://cdn.openai.com/papers/whisper.pdf

– GitHub: https://github.com/openai/whisper

– Colab: https://colab.research.google.com/…/LibriSpeech.ipynb

– Medium: https://towardsdatascience.com/openai-whisper-holds-the-key-to-gpt-4-a7f922a7dad9

Post Views: 41
AI Intelligence Genetické algoritmy Novinky Strojové učení Text a sekvenceAI umělá inteligence

Related Posts

20 dubna, 2018

Babelnet

12 prosince, 2017

Tesla pracuje na vlastních čipech pro AI: plně autonomní vozy do dvou let?

19 dubna, 2020

Co si přečíst o umělé inteligenci?

Nejnovější příspěvky

  • Vydán klíčový díl o umělé inteligenci na podcastu Deep Talks
  • DigiKomenský – Největší učitel všech dob v podobě Jana Amose Komenského – pro učení dětem i samoukům
  • Ukázka GPT-4
  • OpenAI představí nejnovější hluboké učení – GPT-4
  • Blíží se konec pracovních míst? Strach z umělé inteligence není na místě, má překvapivé využití

Archivy

Rubriky

Štítky

AI AI Awards algoritmus algoritmy Alphai Alpha Industries Amazon Andrew Ng BERT Chatbot DALL·E Data Science Deep Learning DigiHavel digitální filosof Digitální spisovatel Dita Malečková Elon Musk Facebook Gartner Google GPT-2 GPT-3 GPU IBM Jan Tyl Matylda Microsoft Neuronová síť NLP NVIDIA OpenAI podcast Posobota RNN Robot soutěž startup strojové učení TensorFlow Tomáš Sedláček umělá inteligence Český rozhlas ČVUT Čína
Copyright Alpha Industries – blog. All rights reserved. | Powered by WordPress & Writers Blogily Theme
Alpha Industries - blog
  • Home
  • O nás
  • Projekty
    • Výzkum
    • Detektor urážek
    • Český detektor emocí
    • Anglický detektor emocí
    • Veřejné mínění emocí
    • Startup Akademie
  • Kariéra
  • Kontakt
  • Kalendář
  • Blog