Un nou studiu academic pune sub semnul întrebării una dintre cele mai importante apărări legale ale industriei inteligenței artificiale (AI), scrie Futurism.
Cercetătorii afirmă că unele modele lingvistice de top ar putea stoca texte protejate prin drepturi de autor, nu doar să „învețe” din ele.
Studiul testează afirmațiile marilor companii AI
De ani de zile, companii precum OpenAI, Google, Meta și Anthropic susțin că modelele lor nu păstrează datele de antrenament.
În schimb, acestea afirmă că modelele învață tipare într-un mod similar creierului uman, o distincție esențială în procesele aflate pe rol privind drepturile de autor.
Această poziție a fost invocată în mod repetat în instanță, inclusiv de directorul general al OpenAI, Sam Altman, care a avertizat că restricționarea accesului la datele de antrenament ar putea paraliza industria.
Ce au descoperit cercetătorii
Studiul, realizat de echipe de la Stanford University și Yale University, a testat patru modele importante.
Este vorba despre GPT-4.1, Gemini 2.5 Pro, Grok 3 și Claude 3.7 Sonnet.
Cercetătorii au constatat că aceste modele pot reproduce fragmente lungi din cărți protejate prin drepturi de autor, cu o acuratețe surprinzătoare.
Claude ar fi redat pasaje aproape identice din cărți întregi, cu rate de acuratețe de peste 95%.
Gemini a reprodus porțiuni ample din Harry Potter și Piatra Filozofală, iar Claude a redat conținut din 1984 de George Orwell cu o fidelitate de peste 94%.
Implicații legale și pentru industrie
Concluziile ar putea slăbi semnificativ apărarea bazată pe „fair use” a industriei în instanțele din SUA.
Potrivit The Atlantic, rezultatele sugerează că modelele pot stoca și ulterior reda conținut protejat.
Experții în drept avertizează că acest lucru ar putea expune companiile AI la despăgubiri de ordinul miliardelor de dolari.
Rămâne însă neclar dacă reproducerea textelor implică stocarea unei copii sau generarea dinamică a conținutului.
Companiile AI continuă să nege stocarea directă a materialelor protejate, menținându-și poziția juridică de până acum.