Pokračuji ve studiu umělé inteligence v „ruské škole“. Je to škola tvrdá, ale dobrá. Trvalo mi 10 minut než jsem vyřešil úlohu s autoenkóderem s chybovostí 6,7%, ale trvalo to tři dny experimentování, než jsem zkrotil velikost chyby na 5%.
První úloha spočívá v tom, že natrénuji jednu síť nazvanou encoder tak, aby zakódovala obrázek lidské tváře co nejefektivněji do pár číslic (na obrázku je to 32 číslic). Pak natrénuji druhou síť nazvanou decoder, aby se z těchto pár číslic pokusila znovu rekonstruovat obrázek. Je to vlastně chytrá a ztrátová superkomprese obrázku.
32 číslic je na popis obrázku dost málo. Síť se musí soustředit jen na to důležité. Jak se vám výsledky líbí?
Tady se to povedlo celkem hezky. Tvář zrekonstruovaná z pouhých 32 čísel je si podobná a působí jen poněkud rozmazaně.
Trošku horší výsledek je dán pravděpodobně nerovnoměrným rozložením datasetu. Síť nepřesně rekonstruuje širší nos a plná při-otevřená ústa.
Vcelku hezká rekonstrukce. Připadá mi, že poněkud zmírnila ostré rysy.
Tak tady to pěkně odnesly brýle. Jejich struktura je na tak silnou kompresi moc složitá. Také výraz úst byl přeložen jako nějaký běžnější.