Svět umělé inteligence (AI) je na pokraji krize, varuje nová studie publikovaná v prestižním časopisu Nature. Tzv. „teorie mrtvého internetu“ je stále více skloňovaným pojmem, který přináší znepokojivé předpovědi o budoucnosti internetu, kde dominují automatizované a generované obsahy.
Vzestup generované obsahu AI technologií
Aby AI mohla podávat co nejefektivnější a nejpřesnější informace, musí být trénována na velkém množství dat. Kvalita těchto dat je ale stejně důležitá jako jejich kvantita. V současnosti je internet zaplaven obsahem vytvořeným AI – od zpravodajských článků po videa a hudbu. Tento trend se neustále zvyšuje, což vede k tomu, že AI začíná trénovat samu sebe na obsahu, který sama vytvořila.
Generováním textu pomocí AI se například v Česku netají ani Česká národní banka (ČNB), která tuto skutečnost přiznala i pod svým článkem o vzestupu umělé inteligence z letošního dubna.
Degenerace kvality dat
Vědecká studie publikovaná v časopisu Nature upozorňuje na závažné důsledky této praxe. „Pokud se AI trénuje na vlastním obsahu, dochází k postupné degradaci kvality dat. Výsledkem je, že AI začne produkovat obsah, který je repetitivní a postrádá smysl,“ uvádí tým vědců ve zmíněné studii. Výzkum tedy ukazuje, že stačí jen několik cyklů tohoto typu tréninku, aby se AI začala chovat chaoticky a generovala nesmyslné informace.
Jedním z příkladů je experiment, ve kterém byl AI systém trénován na textech o středověké architektuře. Po devíti generacích tréninku na vlastních textech se výsledky změnily v nesouvislé „bláboly“. „Tento scénář ilustruje, jak rychle může dojít k poklesu kvality informací, což vede ke ztrátě jejich hodnoty,“ tvrdí autoři studie.
Dalším problémem je, že při tréninku AI na těchto datech mohou být vynechána méně častá data. To vede k dalšímu úbytku rozmanitosti informací a k vytváření odpovědí, které nejsou úplné ani přesné. Namísto toho, aby AI poskytovala užitečné odpovědi, začne generovat odpovědi, které jsou zavádějící a nesprávné.
Vědci na základě zmíněného výzkumu varují, že pokud se situace nezmění, může dojít k úplnému rozpadu systémů AI. Toto varování přichází v době, kdy se AI stává stále více integrovanou do našeho každodenního života a průmyslu.
Podobně, Timnit Gebruová, známá výzkumnice v oblasti AI, nedávno v rozhovoru pro NYU McSilver Institute upozornila na nebezpečí zkreslení a nedostatku reprezentace v datech, což může vést k nesrovnalostem a chybám v AI systémech. Gebruová a další výzkumníci volají po přísnějších kontrolách a regulacích, aby se zabránilo možným negativním důsledkům.
Budoucnost AI
Společnosti, které začaly trénovat AI modely dříve, mají v současné době výhodu, protože v té době nebylo tolik obsahu, který byl generován umělou inteligencí. Tyto modely jsou přesnější, ale náskok se podle provedeného výzkumu zmenšuje.
Výzkum publikovaný v časopisu Nature tak zdůrazňuje, že je na místě problém řešit hned, aby bylo možné nadále těžit z výhod trénování AI na velkých množstvích dat z internetu.
Budoucnost AI závisí na schopnosti několika společností (OpenAI, Google, Meta, Microsoft, pozn. red.) tento problém vyřešit. Pokud se podaří zavést správné mechanismy pro zajištění kvality dat a rozmanitosti informací, může AI nadále přinášet významné přínosy pro náš svět. Pokud ne, pak podle vědců hrozí, že se AI systémy stanou nespolehlivými a méně užitečnými, než jsme si kdy vůbec dokázali představit – v takovém případě nás čeká mrtvý internet.
Autor: Petr Ševčík