Un bot de la OpenAI a încercat să spargă site-ul de comerț electronic al Triplegangers
Sâmbătă, 4 ianuarie, directorul general al Triplegangers, Alexandr Tomciuk, a fost anunțat că site-ul de comerț electronic al companiei sale nu funcționează.

Părea un fel de atac distribuit de tip „refuz de serviciu”. El a descoperit curând că vinovatul era un bot de la OpenAI care încerca neîncetat să spargă întregul site, relatează incrussia.ru.
„Avem mai mult de 65.000 de produse, fiecare produs are propria sa pagină. Fiecare pagină are cel puțin trei fotografii”, explică Tomciuk.
OpenAI a trimis „zeci de mii” de cereri către server, încercând să încarce sute de mii de fotografii împreună cu descrierile lor detaliate.
„OpenAI a folosit 600 de adrese IP pentru a colecta date și noi încă analizăm jurnalele de săptămâna trecută, probabil că sunt mult mai multe”, spune Tomciuk despre adresele IP folosite de bot pentru a încerca să spargă site-ul.
„Scanerele lor ne doborau site-ul”, spune directorul general de la Triplegangers. „Practic, a fost un atac DDoS”. Compania cu șapte angajați a petrecut mai mult de un deceniu acumulând ceea ce numește cea mai mare bază de date de „dubluri umane digitale” de pe Internet, referindu-se la fișiere de imagini 3D scanate de la modele umane reale.
Triplegangers vinde fișiere de obiecte 3D, precum și fotografii, de la mâini la păr, piele și corp în general, artiștilor 3D, creatorilor de jocuri video și tuturor celor care au nevoie să recreeze digital caracteristici umane autentice.
Echipa lui Tomciuk, cu sediul în Ucraina și licențiată și în SUA, are o pagină de termeni de serviciu pe site-ul său care interzice roboților să facă fotografii fără permisiune. Dar această condiție în sine nu are niciun efect. Site-urile web trebuie să utilizeze un fișier robot.txt configurat corespunzător, cu etichete care să-i spună în mod specific robotului OpenAI, GPTBot, să lase site-ul în pace. (OpenAI are și alți boți, ChatGPT-User și OAI-SearchBot, care au propriile etichete, conform paginii de căutare).
Robot.txt, cunoscut și sub numele de Robots Exclusion Protocol, a fost creat pentru a spune motoarelor de căutare ce să nu vizualizeze atunci când indexează pagini web. Pe pagina sa de informații, OpenAI susține că ia în considerare astfel de fișiere dacă sunt configurate cu propriul set de etichete do-not-crawl, dar avertizează, de asemenea, că boților săi le poate lua până la 24 de ore pentru a recunoaște un fișier robot.txt actualizat.
După cum a remarcat Tomciuk, dacă un site nu utilizează robot.txt în mod corespunzător, OpenAI și alții cred că pot să se amestece cât vor. Triplegangers a fost în cele din urmă închis de robotul OpenAI în timpul orelor de lucru în SUA. Acum, compania se așteaptă, de asemenea, la o creștere a facturii AWS din cauza întregii sarcini procesorului și a descărcărilor de la bot.
După acest incident, Tomciuk și-a configurat corect fișierul robot.txt și contul Cloudflare înființat pentru a bloca GPTBot-ul și alți câțiva boți pe care i-a descoperit, precum Barkrowler (un crawler SEO) și Bytespider (un crawler TokTok). El speră, de asemenea, că a reușit să blocheze crawlerele (robot de căutare) de la alte companii de modele de inteligență artificială.
Cu toate acestea, Tomciuk încă nu știe ce anume a reușit botul să elimine sau a încercat să elimine. El nu a găsit o modalitate de a contacta OpenAI pentru a întreba. De asemenea, compania nu a răspuns la solicitarea de comentarii a TechCrunch.
„Suntem într-o afacere în care drepturile sunt o problemă serioasă, deoarece scanăm oameni reali”, a spus Tomciuk. Cu legi precum GDPR din Europa, „ei nu pot să facă o poză oricui online și să o folosească”.
„Este înfricoșător pentru că pare să existe o portiță de scăpare pe care aceste companii o folosesc pentru a colecta date, spunând: «Puteți evita acest lucru dacă vă actualizați robot.txt cu etichetele noastre», dar acest lucru pune responsabilitatea pe proprietarul afacerii de a înțelege cum să le blocheze”, a spus directorul general.
„Cele mai multe site-uri sunt lăsate în întuneric cu privire la posibilitatea de a fi piratate de acești roboți. Acum trebuie să monitorizăm zilnic activitatea jurnalelor pentru a detecta acești boți”, avertizează Tomciuk.
Principala amenințare cibernetică pentru mediul de afaceri rusesc în 2024, alături de atacurile programelor rău inteționate (ransomware), este reprezentată de scurgerile de baze de date. Potrivit experților, mai mult de 250 de baze de date nepublicate anterior ale companiilor rusești au apărut în spațiul public pe parcursul anului. Numărul atacurilor ransomware a crescut cu 44% în cursul anului, au declarat analiștii.
Acum ne puteți urmări și pe Telegram, Facebook și Instagram pentru a fi la curent cu ultimele știri.


