Menu
  • Home
  • O nás
  • Projekty ▾
    • Výzkum
    • Detektor urážek
    • Český detektor emocí
    • Anglický detektor emocí
    • Veřejné mínění emocí
    • Startup Akademie
  • Kariéra
  • Kontakt
  • Kalendář
  • Blog
Skip to content

Nové AI naklonuje váš hlas z pouhých 5 vteřin hlasového záznamu!

by Eva Popílková | Posted on 15. 11. 201917. 11. 2019

Nový výzkum nám představuje AI převádějící text na řeč (TTS). Algoritmus je tradičně založený na neuronové síti. Při podrobnějším pohledu se skládá ze 3 hlavních komponent:

1) Speaker encoder network (naučený od tisíce řečníků – odtud zná systém jak zní lidský hlas.

2) Dále následuje síť pro syntézu sekvencí založená na Tacotronu 2, která generuje spektrogram z textu.

3) Jako poslední část slouží auto-regresivní vokodér založený na WaveNet, který převádí spektrum na sekvenci vzorků.

Více informací v odkazech.

Ukázka a základní vysvětlení:

Paper: https://arxiv.org/abs/1806.04558

Post Views: 477
Novinky Text a sekvenceAI algoritmus auto-regresivní vokodér Neuronová síť Speaker encoder network spektrogram Tacotron 2 TTS WaveNet

Related Posts

1 června, 2019

Odstartovala první AI Akademie pro střední školy!

20 března, 2020

Už jste slyšeli o AI Awards 2019?

17 června, 2019

3 knihovny, které vám pomohou interpretovat váš model

Nejnovější příspěvky

  • Block-Recurrent Transformer
  • Minerva od Googlu vyřeší třetinu cvičných problémů vysokoškolské matematiky, fyziky, chemie, ekonomie a biologie!
  • Interview s Robinem Čumpelíkem na téma technologie, AI, manipulace a dalších témat
  • Westworld 4
  • Praha musí více investovat do umělé inteligence

Archivy

Rubriky

Štítky

AI AI Awards algoritmus algoritmy Alphai Alpha Industries Amazon Andrew Ng BERT Chatbot Data Science Deep Learning digitální filosof Digitální spisovatel Dita Malečková Elon Musk Facebook Gartner Google GPT-2 GPT-3 GPU IBM Jan Tyl Matylda Microsoft ML Neuronová síť NLP NVIDIA OpenAI podcast Posobota RNN Robot soutěž startup strojové učení TensorFlow Tomáš Sedláček umělá inteligence word2vec Český rozhlas ČVUT Čína
Copyright Alpha Industries – blog. All rights reserved. | Powered by WordPress & Writers Blogily Theme
Alpha Industries - blog
  • Home
  • O nás
  • Projekty
    • Výzkum
    • Detektor urážek
    • Český detektor emocí
    • Anglický detektor emocí
    • Veřejné mínění emocí
    • Startup Akademie
  • Kariéra
  • Kontakt
  • Kalendář
  • Blog