Co nového ve světě AI? Úspěšně jsme dokončili další fázi DigiHavla! Během pilotu položili studenti i učitelé tisíce jedinečných a mnohdy velmi rafinovaných dotazů. Děkuji moc. Díky nim bude další verze zase chytřejší. Pokračuji ve svém malém přednáškovém turné. Další bude 1.12. na VŠE.
Ale nezaháleli ani vědci z Meta AI (Facebook), když v půlce listopadu spustili demo velkého jazykového modelu pojmenované Galactica. Model by měl uchovávat, kombinovat a zdůvodňovat vědecké poznatky. Jeho silnou stránkou mají být zejména technické znalosti, jako jsou rovnice v LaTeXu, matematika a podobně. Model byl vycvičen „na 106 miliardách tokenů vědeckých textů a veřejně dostupných dat. V tom jsou zahrnuty zejména články, učebnice, vědecké webové stránky, encyklopedie, znalostní databáze a podobně. Pouhé dva dny po spuštění online dema, byl veřejný model zastaven po vlně kritiky ze strany některých vědců a médií. Model se totiž ukázal být potenciálně nebezpečným generátorem pseudovědeckých nesmyslů. Je zřejmé, že došlo k nepochopení toho jak tyto modely dnes fungují a řada laiků měla od tohoto modelu přehnaná očekávání. Podobně jako GPT-3 si vymýšlí realisticky vypadající články ve kterých autenticky kombinuje pravdu a fikci. Mnoho lidí nepochopilo, že výstupy modelu je žádoucí brát spíše jako inspiraci, tipy a doporučení a je vhodné si je nezávisle ověřovat. Myslím, že to může být skvělý nástroj, pokud víme, jako ho správně používat. Podobně jako u GPT-3 vyšlo i zde hned několik modelů podle velikosti od mini s 125 miliony parametry po huge s 120 miliardami parametrů.
Zkusil jsem model Galactica standard (i tento prostřední 7 miliard parametrů velký model zabírá téměř 30 giga) na DigiHavla a „doporučil“ mi spolupráci s Národním programem rozvoje umělé inteligence v ČR (NP AI), dále s ČVUT, ČTU a financování od MŠMT. Doporučuje mi zamyslet se nad použitím frameworku Dialogflow. Na konkrétní vědecké otázky mi standard odpovídá v souladu s paperem hůře než největší GPT-3. Škoda, že už není tak triviální si vyzkoušet huge.
Nejspíš jste také zaznamenali nový model na generování obrázků Stable Diffusion v2. Původní model SD V1 od společnosti CompVis, byl unikátní zejména otevřeným zdrojovým kódem a vytvořil stovky různých modelů a vylepšení po celém světě. Čím se liší verze 1 od verze 2? Já jsem ocenil především rozlišení. Nyní může být výstup ve výchozím rozlišení 768×768 pixelů. Stable Diffusion 2.0 nyní obsahuje model Upscaler Diffusion, který zvyšuje rozlišení obrazu čtyřnásobně. Dále by měla znesnadňovat uživatelům napodobovat styly konkrétních umělců nebo generovat výstup NSFW (nahota, pornografie…).
Zdroje:
3.) https://www.youtube.com/watch?v=ZTs_mXwMCs8
SD2: