Cerca
Close this search box.

L’AI cambia le regole del copyright

Gli algoritmi di machine learning dietro ai Large Language Model come ChatGPT richiedono per l’addestramento enormi quantità di testi, che si ottengono scaricando (scraping) tutto il web. Stessa cosa per l’AI generativa che produce immagini.

Che il materiale sia pubblico non significa che possa essere liberamente utilizzato per altri scopi, come creare dei chatbot AI.

Non è chiarissimo quali fonti OpenAI, Google, e gli altri grandi player utilizzino e c’è chi sospetta che all’interno dei dataset per l’addestramento ci siano anche libri coperti da copyright. Ma sicuramente la maggior parte del materiale postato da noi utenti viene scaricato senza chiedere un consenso esplicito.

Per evitare questo problema Google, alla consultazione fatta dal governo Australiano in vista della modifica delle leggi sull’AI, ha proposto non solo la clausola del fair use come in passato, ma addirittura che l’onere di esprimere il proprio rifiuto all’utilizzo del materiale risieda nel titolare del copyright.

Il modello proposto è simile a quello della limitazione ai motori di ricerca: compilando il file robot.txt nella root directory del vostro sito potete negare il consenso alla raccolta e indicizzazione dei contenuti che avete pubblicato su web.

La motivazione di Google è ovviamente il bene comune e la colpa è delle regole vecchie che arrivano da un mondo passato: “Crediamo che tutti traggano vantaggio da un vivace ecosistema di contenuti. La chiave di ciò è che gli editori web hanno la possibilità di scegliere e controllare i propri contenuti e l’opportunità di trarre valore dalla partecipazione all’ecosistema web. Tuttavia, riconosciamo che i controlli esistenti per i publisher web sono stati sviluppati prima di nuovi casi d’uso di intelligenza artificiale e ricerca.”

Se si vuole riprodurre qualcosa che è detenuto da un titolare del copyright, bisogna ottenere il suo consenso, non un tipo di accordo di rinuncia. Quello che propone Google è un rinnovamento totale del modo in cui funzionano le eccezioni, che ignora meccanismi già esistenti come le licenze Creative Commons.

Questo meccanismo protegge gli attori forti del web, come provano gli accordi fra Google e News Corp, ma lascia gli attori più deboli con il rischio di violazione del loro copyright. La proposta di Google è infatti un primo passo verso normative che non richiedono la compensazione per i creatori di contenuti utilizzati per addestrare i grandi sistemi AI.

La battaglia per la revisione del concetto di copyright nel mondo dell’AI è cominciata.

Ne parla il Guardian in questo articolo:

Accedi per vedere questi contenuti

registrati se non lo ha ancora fatto