Nvidia a descărcat masiv videoclipuri de pe YouTube pentru a antrena IA
În același timp, compania a ignorat complet problemele legate de drepturile de autor, care nu i-au plăcut proprietarilor de platforme și producătorilor de conținut.

Conform documentelor interne și a corespondenței obținute de 404 Media, Nvidia a colectat videoclipuri „în mărimea unei vieți umane” din diverse resurse de pe internet. Potrivit unui fost angajat Nvidia, care dorea să rămână anonim, lucrătorii au fost însărcinați să descarce videoclipuri de pe Netflix și YouTube și alte platforme pentru a antrena un model de inteligență artificială conceput pentru a genera lumea tridimensională Omniverse, sisteme de mașini autonome și viitorul „om digital”. Proiectul poartă numele de „Cosmos”, scrie 3dnews.ru.
Angajații companiei au folosit software gratuit, open source yt-dlp și mașini virtuale care actualizează adresele IP pentru a evita blocarea de a descărca conținut în bloc de pe YouTube . Provocarea a fost de a obține echivalentul a „80 de ani de viață” în fiecare zi.
E-mailurile analizate de 404 Media arată că managerii de proiect au discutat despre utilizarea a 20-30 de mașini virtuale în Amazon Web Services pentru a încărca un volum atât de mare de materiale video pe zi. Când angajații au ridicat întrebări cu privire la legalitatea utilizării conținutului protejat prin drepturi de autor, conducerea i-a asigurat că decizia a fost aprobată la cel mai înalt nivel al companiei.
Într-un mesaj către 404 Media, un reprezentant Nvidia a spus că compania respectă drepturile tuturor creatorilor de conținut și consideră că modelele și eforturile sale de cercetare „sunt în totalmente conform legii dreptului de autor.”
„Legea drepturilor de autor protejează produsul final, dar nu faptele, ideile, datele , sau informațiile. Oricine poate afla fapte, idei, date sau informații dintr-o altă sursă și le poate folosi pentru a-și crea propriul produs. Utilizarea loială protejează, de asemenea, capacitatea de a utiliza o lucrare într-un scop transformator, cum ar fi formarea unui model de IA”, a spus compania.
Cu toate acestea, YouTube și Netflix au subliniat că o astfel de utilizare a conținutului lor încalcă condițiile platformelor. Un reprezentant Netflix a mai spus pentru 404 Media că nu au un acord cu Nvidia pentru a furniza conținut, iar termenii de utilizare ai platformei nu permit web scraping-ul, care este folosit de scripturile de server pentru a efectua automat descărcări.