Menu
  • Home
  • O nás
  • Projekty ▾
    • Výzkum
    • Detektor urážek
    • Český detektor emocí
    • Anglický detektor emocí
    • Veřejné mínění emocí
    • Startup Akademie
  • Kariéra
  • Kontakt
  • Kalendář
  • Blog
Skip to content

Nové AI naklonuje váš hlas z pouhých 5 vteřin hlasového záznamu!

by Eva Popílková | Posted on 15. 11. 201917. 11. 2019

Nový výzkum nám představuje AI převádějící text na řeč (TTS). Algoritmus je tradičně založený na neuronové síti. Při podrobnějším pohledu se skládá ze 3 hlavních komponent:

1) Speaker encoder network (naučený od tisíce řečníků – odtud zná systém jak zní lidský hlas.

2) Dále následuje síť pro syntézu sekvencí založená na Tacotronu 2, která generuje spektrogram z textu.

3) Jako poslední část slouží auto-regresivní vokodér založený na WaveNet, který převádí spektrum na sekvenci vzorků.

Více informací v odkazech.

Ukázka a základní vysvětlení:

Paper: https://arxiv.org/abs/1806.04558

Post Views: 557
Novinky Text a sekvenceAI algoritmus auto-regresivní vokodér Neuronová síť Speaker encoder network spektrogram Tacotron 2 TTS WaveNet

Related Posts

14 dubna, 2021

Setkání se studenty na IT gymnázium

19 září, 2020

A další zmínka o nás…

12 února, 2020

Expertní tým bude řešit problematiku výzkumu, vývoje a dopadů využívání umělé inteligence v ČR

Nejnovější příspěvky

  • Vydán klíčový díl o umělé inteligenci na podcastu Deep Talks
  • DigiKomenský – Největší učitel všech dob v podobě Jana Amose Komenského – pro učení dětem i samoukům
  • Ukázka GPT-4
  • OpenAI představí nejnovější hluboké učení – GPT-4
  • Blíží se konec pracovních míst? Strach z umělé inteligence není na místě, má překvapivé využití

Archivy

Rubriky

Štítky

AI AI Awards algoritmus algoritmy Alphai Alpha Industries Amazon Andrew Ng BERT Chatbot DALL·E Data Science Deep Learning DigiHavel digitální filosof Digitální spisovatel Dita Malečková Elon Musk Facebook Gartner Google GPT-2 GPT-3 GPU IBM Jan Tyl Matylda Microsoft Neuronová síť NLP NVIDIA OpenAI podcast Posobota RNN Robot soutěž startup strojové učení TensorFlow Tomáš Sedláček umělá inteligence Český rozhlas ČVUT Čína
Copyright Alpha Industries – blog. All rights reserved. | Powered by WordPress & Writers Blogily Theme
Alpha Industries - blog
  • Home
  • O nás
  • Projekty
    • Výzkum
    • Detektor urážek
    • Český detektor emocí
    • Anglický detektor emocí
    • Veřejné mínění emocí
    • Startup Akademie
  • Kariéra
  • Kontakt
  • Kalendář
  • Blog