La resistenza all’IA sta causando problemi a Internet Archive e al giornalismo stesso

Più di duecento giornalisti hanno firmato una lettera aperta per esprimere gratitudine verso Internet Archive e la sua Wayback Machine, il sistema che conserva e rende consultabili nel tempo le pagine web archiviate. I firmatari intendono evidenziare come si tratti di uno strumento essenziale per il giornalismo d’inchiesta, capace di restituire accesso a portali scomparsi o modificati, e quindi di preservare la memoria digitale del dibattito pubblico. Questo sostegno arriva in un momento delicato per l’organizzazione non profit: un numero crescente di testate sta bloccando la sua possibilità di salvare gli articoli, impedendole di aggiungere nuovi contenuti al suo database. Se questa tendenza dovesse proseguire, una parte significativa della storia del web rischierebbe di svanire, privando giornalisti e cittadini di una risorsa cruciale per la trasparenza e la verifica delle fonti.

La lettera è stata pubblicata a metà aprile e, da allora, ha lentamente guadagnato visibilità, soprattutto sui profili social dei giornalisti, dove è diventata una presenza sempre più ricorrente. «Nelle generazioni precedenti, per verificare i reportage storici, i giornalisti si sarebbero affidati agli archivi fisici di una testata locale o delle biblioteche pubbliche, seguendo i fili del presente indietro nella storia», si legge nel comunicato. «Con molte testate ormai chiuse e senza un percorso chiaro che permetta alle biblioteche pubbliche di conservare le indagini in formato digitale, il compito di salvaguardare le cronache giornalistiche ricade sempre più sulle spalle di Internet Archive».

Il gruppo fa riferimento a ciò che in gergo si definisce “link rot”, ovvero la progressiva decomposizione dei contenuti online: pagine, articoli e documenti che scompaiono o diventano irraggiungibili molto più rapidamente di quanto si immagini. Nel 2024, il Pew Research Center stimava che il 38% dei contenuti pubblicati nell’arco degli ultimi dieci anni fosse ormai perduto. Le cause sono molteplici: fusioni e cessioni aziendali, fallimenti, riduzione dei materiali archiviati sui server, ma anche il semplice disinteresse nel mantenere pagine considerate obsolete che, nel loro piccolo, comportano comunque costi di conservazione.

Internet Archive cerca di tamponare questa criticità preservando la memoria di siti considerati di rilievo e di pagine segnalate direttamente dalla community. In questo modo continua a rappresentare uno degli ultimi baluardi dell’Internet nella sua accezione divulgativa, democratizzante e orizzontale. Negli ultimi mesi, tuttavia, il portale si trova ad affrontare una nuova difficoltà che si somma ai conflitti storici con i grandi gruppi aziendali, spesso contrari alla condivisione dei propri contenuti con l’organizzazione. Molte testate hanno infatti introdotto sistemi per impedire il rastrellamento automatico dei dati. Il risultato è che Internet Archive fatica sempre più ad archiviare i contenuti recenti, rischiando di perdere proprio quella parte di memoria digitale che si propone di salvaguardare.

Non si tratta però di un attacco diretto: Internet Archive si trova nel mezzo di un fuoco incrociato, con i quotidiani che hanno rivisto la gestione dei propri siti nel tentativo disperato di contrastare l’esfiltrazione dei dati da parte delle aziende impegnate ad addestrare modelli di intelligenza artificiale, talvolta con modalità di legittimità discutibile. Il nodo è che gli stessi meccanismi di raccolta automatica impiegati dalle società di IA per saccheggiare articoli e contenuti sono identici a quelli utilizzati da Internet Archive per preservare e catalogare le informazioni chiave. Ne deriva un conflitto tecnico e culturale difficile da risolvere.

La lettera aperta non affronta direttamente questa questione, si limita a ribadire l’importanza cruciale di Internet Archive come strumento di lavoro, sottolineando che molte inchieste contemporanee dipendono dalla sua esistenza. Non vengono formulate richieste né prese di posizione esplicite contro le decisioni delle redazioni, tuttavia è difficile non cogliere un sottotesto di preoccupazione e di appello implicito verso chi guida le aziende editoriali – un invito a riflettere sul fatto che le scelte dirigenziali stanno progressivamente erodendo la possibilità di fare buon giornalismo, limitando l’accesso alle fonti e alla memoria digitale collettiva.

Avatar photo

Walter Ferri

Giornalista milanese, per L’Indipendente si occupa di analisi nel campo della tecnologia, dei diritti informatici, della privacy e dei nuovi media, indagando le implicazioni sociali ed etiche delle nuove tecnologie. È coautore e curatore del libro Sopravvivere nell'era dell'Intelligenza Artificiale.

L'Indipendente non riceve alcun contributo pubblico né ospita alcuna pubblicità, quindi si sostiene esclusivamente grazie agli abbonati e alle donazioni dei lettori. Non abbiamo né vogliamo avere alcun legame con grandi aziende, multinazionali e partiti politici. E sarà sempre così perché questa è l’unica possibilità, secondo noi, per fare giornalismo libero e imparziale. Un’informazione – finalmente – senza padroni.

Ti è piaciuto questo articolo? Pensi sia importante che notizie e informazioni come queste vengano pubblicate e lette da sempre più persone? Sostieni il nostro lavoro con una donazione. Grazie.

Articoli correlati

1 commento

Iscriviti a The Week
la nostra newsletter settimanale gratuita

Guarda una versione di "The Week" prima di iscriverti e valuta se può interessarti ricevere settimanalmente la nostra newsletter

Ultimi

Articoli nella stessa categoria