Studiul „creierului” inteligenței artificiale a arătat că memoria și raționamentul sunt separate în acesta

Cercetătorii au descoperit că, în modelele mari de inteligență artificială, precum ChatGPT, memoria și raționamentul sunt separate la nivel arhitectural.

Studiul „creierului” inteligenței artificiale a arătat că memoria și raționamentul sunt separate în acesta.

Modelele de inteligență artificială, antrenate pe volume uriașe de date, se bazează pe cel puțin două funcții cheie. Prima este memoria, care permite sistemului să extragă și să reproducă informații. A doua este gândirea logică (raționamentul), adică rezolvarea de noi probleme prin aplicarea principiilor generalizate și a tiparelor învățate. Totuși, până acum nu se știa cum sunt organizate aceste abilități esențiale.

Pentru a afla acest lucru, specialiștii în învățare automată de la startup-ul Goodfire.ai au studiat structura internă a modelelor mari de limbaj și vizuale.

Cum este organizat „creierul” IA

Mai întâi au aplicat metoda matematică K-FAC (curbură aproximativă cu factorul Kronecker) pentru a identifica componentele responsabile pentru diferite abilități. S-a descoperit că simpla memorare a datelor este asociată cu componentele cu curbură joasă (canale înguste și specializate de memorie), în timp ce gândirea logică flexibilă este asociată cu componentele cu curbură ridicată (mecanisme largi și generale de procesare).

Apoi au dezactivat părți ale IA legate de memorie și au testat modelul pe diferite sarcini, inclusiv răspunsuri la întrebări factuale și rezolvarea de probleme noi. Experimentul a arătat că, chiar și cu memoria dezactivată, modelele păstrează capacitatea de raționament logic. Aceasta demonstrează că cele două funcții ocupă zone diferite în arhitectura IA.

„Metoda noastră, bazată pe analiza curburii, suprimă cea mai eficientă memorarea în modelele de orice dimensiune (...) și, în același timp, asigură o generalizare mult mai bună la datele necunoscute anterior”, au menționat cercetătorii.

Dezactivarea componentelor IA a avut un efect neașteptat. Deși capacitatea generală de rezolvare a problemelor s-a păstrat, abilitățile matematice și capacitatea de a aminti fapte individuale au fost afectate semnificativ.

„Aritmetica și reproducerea faptelor din memorie se bazează mai mult pe componentele cu curbură joasă și sunt cele mai afectate de intervenție, în timp ce raționamentele logice bazate pe context și fără utilizarea numerelor se păstrează în mare parte, iar în unele cazuri chiar se îmbunătățesc”, au explicat autorii.

Căi pentru creșterea siguranței IA

Înțelegerea exactă a principiilor de funcționare ale IA va fi cheia pentru sporirea siguranței acesteia și câștigarea încrederii publicului. Una dintre problemele modelelor cu memorare este riscul de scurgere a informațiilor private sau a textelor protejate prin drepturi de autor. În plus, în procesul de memorare, modelul poate învăța stereotipuri dăunătoare sau conținut toxic.

Aceste probleme pot fi evitate dacă inginerii învață să identifice și să elimine precis mecanismele de memorare simplă, fără a afecta inteligența generală a sistemului. Înțelegerea structurii „canalelor” de memorie va permite, de asemenea, ca modelele IA să fie mai eficiente și mai ieftin de utilizat, prin optimizarea spațiului de rețea pe care îl folosesc.

Acum ne puteți urmări și pe Telegram, Facebook și Instagram pentru a fi la curent cu ultimele știri.