
Az Energiastratégia Intézet elemzésében a mesterséges intelligencia gazdasági és társadalmi következményeit vizsgálta.
A big data Ă©s a számĂtástechnika exponenciális fejlĹ‘dĂ©se rĂ©vĂ©n a mestersĂ©ges intelligencia (AI) jelenleg hatalmas mennyisĂ©gű adatot dolgozhat fel, Ă©s olyan feladatok ellátását is megtanulhatja, amelyek esetĂ©ben az emberek kiváltása korábban elkĂ©pzelhetetlen volt. A technolĂłgia fejlĹ‘dĂ©sĂ©t azonban akadályozhatja az AI-modellek tanĂtásához használt emberi adatforrások kimerĂĽlĂ©se, Ă©s emiatt a fejlesztĹ‘knek Ăşj megoldásokat kell találniuk ezek kĂ©pzĂ©sĂ©re.
A generatĂv AI, vagyis az Ăşj, eredeti tartalmak előállĂtására kĂ©pes mestersĂ©ges intelligencia megjelenĂ©se viszont több ágazatban már most jelentĹ‘s változásokkal jár – ám ennek az átalakulásnak nemcsak pozitĂv gazdasági, hanem negatĂv társadalmi következmĂ©nyei is lehetnek.
Elon Musk szerint a mestersĂ©ges intelligenciát fejlesztĹ‘ vállalatok már tavaly kimerĂtettĂ©k a modelljeik tanĂtásához használhatĂł emberi adatforrásokat, ezĂ©rt a fejlesztĹ‘knek a továbbiakban szintetikus, azaz maguk az AI-modellek által generált adatokat kell használniuk a rendszerek Ă©pĂtĂ©sĂ©hez Ă©s finomhangolásához. A mĂłdszert már számos vállalat alkalmazza: a Google Ă©s a ChatGPT-t fejlesztĹ‘ OpenAI mellett a Meta Llama nevű, valamint a Microsoft a Phi 4 elnevezĂ©sű modelljĂ©nĂ©l is Ă©ltek már vele. SĹ‘t Musk saját AI-jal foglalkozĂł vállalatánál, az xAI-nál is ezt az utat követik.
A szintetikus adatokkal fejlesztett mestersĂ©ges intelligencia a tanulás során kiĂ©rtĂ©keli a saját maga által kĂ©szĂtett tartalmakat, ezĂ©rt a megoldásra egyfajta öntanĂtĂł folyamatkĂ©nt tekinthetĂĽnk. A mĂłdszer ugyanakkor nem tudja teljesen helyettesĂteni az emberi adatforrások használatát, alkalmazása során ugyanis a modellek hajlamosabbak a „hallucináciĂłra”, azaz a pontatlan vagy Ă©rtelmetlen eredmĂ©nyek produkálására.
Az Epoch AI nevű kutatĂłintĂ©zet 2024-es tanulmánya szerint ha a jelenlegi nagy nyelvi modellek (LLM) fejlesztĂ©si trendjei folytatĂłdnak, akkor 2026 Ă©s 2032 között állhat elĹ‘ az a helyzet, hogy elfogy az összes elĂ©rhetĹ‘, emberek által kĂ©szĂtett szöveges adatforrás. EttĹ‘l kezdve a nyilvánosan hozzáfĂ©rhetĹ‘, emberek által Ărt szöveges adatforrások mennyisĂ©ge már az LLM-ek fejlĹ‘dĂ©sĂ©nek korlátozĂł tĂ©nyezĹ‘jĂ©vĂ© válhat. A folyamatot körĂĽlbelĂĽl egy Ă©vvel gyorsĂtja fel a tĂşltanĂtást (overtraining), amelyet a fejlesztĹ‘k a modell hibáinak felfedĂ©sĂ©re alkalmaznak.
Az elemzés tovább olvasható az Energiastratégia Intézet publikációjában.
FotĂł: Canva