Máme tu další novinku pro milovníky jazykových modelů. Model Minerva je založen na jazykovém modelu Google Pathways, který obsahuje 540 miliardách parametrů. Školen byl nejprve na obecných jazykových datech a poté dotrénován na technickém obsahu. Zdá se, že ve svém zaměření je nyní nejlepší svého druhu. Matematické i přírodovědné otázky řeší pomocí uvažování „krok za krokem“. Model byl trénován na 118GB datovém souboru vědeckých prací ze serveru arXiv a webových stránek, které obsahují matematické výrazy používající LaTeX, MathJax nebo jiné matematické formáty.
Zdroje:
- https://ai.googleblog.com/2022/06/minerva-solving-quantitative-reasoning.html?fbclid=IwAR3y99mIqQdDVeoDvlQsIMyOOmdEhABoVsFNerC8MmqfJfgX7fCXtLqG8vs
- Výzkumný článek o Minervě: https://arxiv.org/abs/2206.14858?fbclid=IwAR3xEJ3qFOFveZtEAUBxLqYDdlF711Dc0_qcUJonWbPtSHyGP3-9QZsGJ2o
- Chain of Thought vysvětlení od Googlu: https://ai.googleblog.com/2022/05/language-models-perform-reasoning-via.html?fbclid=IwAR3vqUMZDMAfEzpyiFbDDtdJ7qNmQ-oGpJtuyZ55kwOqPIK5fFdDHTPeWlo
- Výzkum Chain of Thought: https://arxiv.org/abs/2201.11903?fbclid=IwAR3xEJ3qFOFveZtEAUBxLqYDdlF711Dc0_qcUJonWbPtSHyGP3-9QZsGJ2o
- Meier, RD, Cheney, DL a Seyfarth, RM (1990). Pamatují si zvířata minulost a plánují budoucnost? Behavioral and Brain Sciences, 13(1), 1–16.
- https://pub.towardsai.net/how-minerva-a-new-nlp-model-performs-better-than-gpt-3-f7713458b59b