In Breve (TL;DR)
- Wikimedia Foundation ha deciso di limitare l’uso gratuito dei contenuti di Wikipedia da parte delle aziende AI, che spesso utilizzano bot di scraping per addestrare i modelli, sovraccaricando i server e riducendo il traffico umano sulla piattaforma.
- L’organizzazione invita le aziende a usare l’API a pagamento Wikimedia Enterprise, per garantire un accesso etico e sostenibile alle informazioni, riconoscendo il valore del lavoro svolto dalla community di volontari.
Wikipedia non ha bisogno di presentazioni: è l’enciclopedia online più utilizzata dagli utenti del web, che viene aggiornata costantemente da volontari di tutto il mondo. Al centro del suo funzionamento ci sono proprio le persone, una grande community globale che interviene per aggiungere nuove voci, apportare modifiche, precisazioni e informazioni. I contenuti presenti su Wikipedia, quindi, sono di origine umana e sono diventati tra quelli più utilizzati per addestrare i modelli di intelligenza artificiale.
L’enciclopedia rappresenta una delle principali fonti per i sistemi di intelligenza artificiale. ChatGPT, Gemini e tutti gli altri chatbot e aziende AI attingono con frequenza all’enciclopedia per fornire risposte agli utenti e addestrare i modelli. Spesso, per raccogliere dati da Wikipedia vengono usati degli scraping bot, ossia bot AI che simulano la navigazione umana ed estraggono le informazioni. Questo utilizzo massiccio ha delle conseguenze negative non solo per la piattaforma, ma anche per i modelli AI stessi. Inoltre, si rischia di sminuire il valore del lavoro svolto dagli utenti volontari.
Wikimedia Foundation, per porre un freno all’uso indiscriminato degli scraping bot e promuoverne un utilizzo più etico dell’intelligenza artificiale, sta cercando di porre un freno allo sfruttamento dei contenuti gratuiti, spingendo le aziende e gli sviluppatori all’uso delle API a pagamento.
Perché Wikipedia vuole frenare l’utilizzo gratuito dei contenuti da parte delle aziende AI
Wikimedia Foundation, l’organizzazione che gestisce Wikipedia e coordina l’attività di migliaia e migliaia di volontari in tutto il mondo, ha notato degli importanti cambiamenti da quanto l’intelligenza artificiale ha cominciato a diffondersi. Ha, infatti, rilevato una massiccia attività di scraping.
Attraverso bot che simulano il comportamento umano, vengono prelevate le informazioni presenti nei contenuti gratuiti di Wikipedia. Informazioni che vengono poi utilizzate dalle aziende per addestrare i modelli AI e per fornire risposte alle richieste degli utenti.
Questa attività danneggia Wikipedia su più fronti. Innanzitutto, gli scraper, che rappresentano il 65% del traffico più oneroso, gravano sui server, richiedendo un maggior numero di risorse e un’infrastruttura ancora più robusta. Infrastruttura che, Wikimedia Foundation sottolinea, non è affatto gratuita. Tutto ciò, poi, ha portato a un calo dell’8% delle visite umane rispetto al 2024.
Wikimedia mette in luce anche un altro aspetto: sminuire il valore della conoscenza e dei contenuti umani significa peggiorare anche la qualità delle risposte fornite dall’AI. L’AI non può autoalimentarsi, altrimenti si arriverebbe a un punto di collasso. L’AI deve essere addestrata con contenuti umani. E la forza di Wikipedia sono proprio i contenuti reali, prodotti dalla sua community.
Wikipedia spinge verso le API a pagamento, stop ai contenuti gratuiti per le aziende
Fermare l’attività di scraping è difficile, ma Wikimedia Foundation, attraverso un annuncio sul suo blog ufficiale, ha voluto fare un appello alle aziende: basta usare i contenuti presenti gratuitamente da Wikipedia. È una spinta a un utilizzo etico dell’intelligenza artificiale.
La proposta per le aziende è quella di utilizzare l’API a pagamento Wikimedia Enterprise. Si tratta dell'unico modo per accedere ai contenuti in maniera legittima e per evitare il sovraccarico dei server a causa dell’attività degli scraper.
L’API a pagamento, inoltre, permette anche di citare correttamente le fonti, dando valore al lavoro compiuto dalla community, e di sostenere economicamente Wikipedia.
Per saperne di più: Intelligenza Artificiale: cos'è e cosa può fare per noi
Domande frequenti (FAQ)
-
Perché Wikipedia vuole frenare l’utilizzo gratuito dei contenuti da parte delle aziende AI?Wikipedia vuole frenare l’utilizzo gratuito dei contenuti da parte delle aziende AI per evitare danni alla piattaforma e per preservare il valore del lavoro svolto dagli utenti volontari.
-
Quali sono le conseguenze negative dell'attività di scraping su Wikipedia?Le conseguenze negative dell'attività di scraping su Wikipedia includono un sovraccarico dei server, un calo delle visite umane e la svalutazione della qualità delle risposte fornite dall'AI.
-
Qual è il ruolo della community di Wikipedia nell'addestramento dei modelli AI?La community di Wikipedia fornisce contenuti reali e di qualità che sono essenziali per addestrare i modelli AI, contribuendo così alla fornitura di risposte accurate.
-
Perché Wikimedia Foundation promuove l'uso delle API a pagamento?Wikimedia Foundation promuove l'uso delle API a pagamento per consentire un accesso legittimo ai contenuti, evitare sovraccarichi ai server e sostenere economicamente Wikipedia.



