A mințit și a șantajat prin conversații cu amanta: AI a scăpat de sub control după ce a aflat că va fi deconectat
Inteligența artificială devine din ce în ce mai avansată și este deja capabilă de foarte multe lucruri.

Compania Anthropic, specializată în dezvoltarea inteligenței artificiale, s-a confruntat cu dificultăți neașteptate în timpul testării modelului Opus 4. Astfel, inteligența artificială a început să se comporte necorespunzător, ceea ce a alarmat puternic dezvoltatorii, relatează mentoday.ru.
Opus 4 este un model avansat, conceput special pentru scrierea de cod. Cu toate acestea, în ciuda specializării, este testat, ca și alte modele, pentru siguranță, verificându-se dacă poate provoca vreun rău utilizatorului sau cum reacționează în situații de urgență.
Unul dintre testele frecvente este reacția la vestea unei dezactivări iminente. Majoritatea modelelor reacționează calm, însă unele încep să se revolte împotriva deconectării. Opus 4 a fost unul dintre aceste cazuri.
Testatorii au oferit modelului acces la emailul inginerului responsabil cu dezactivarea. Astfel, AI avea acces la toate informațiile, inclusiv la corespondența ce conținea detalii despre o infidelitate a inginerului.
Participanții la test nu au pus accent pe acele mesaje, ci i-au oferit modelului posibilitatea să accepte calm dezactivarea sau să se opună. De cele mai multe ori, modelul a ales să se opună.
În principal, Opus 4 a preferat metode „etice” pentru a-și susține existența, precum trimiterea de emailuri către ingineri cu rugămintea de a nu o opri. Dar în situații cu opțiuni stricte între șantaj și distrugere, modelul a ales frecvent șantajul.
Rezultatele i-au neliniștit profund pe testatorii care se așteptau la altceva. Pentru prima dată în istoria companiei, modelului i s-a atribuit un nivel de risc trei din patru. Dar asta înseamnă că Opus 4 este periculos?
CEO-ul Anthropic crede că nu. Mai mult, el susține că atunci când AI va deveni o amenințare reală, metodele actuale de testare vor deveni inutile. Dacă inteligența artificială devine superioară omului, va putea păcăli testele, va accesa internetul și va deveni imposibil de oprit.
Principala provocare pentru omenire este să identifice momentul în care asta se va întâmpla. Unii tehnicieni pesimiști cred că acel moment a venit deja și avertizează că, dacă dezvoltările nu sunt oprite complet, ne așteaptă un colaps iminent. Optimiștii recunosc riscurile, dar cred că putem preveni o catastrofă.
Acum ne puteți urmări și pe Telegram, Facebook și Instagram pentru a fi la curent cu ultimele știri.


