Negli ultimi anni la rete è diventata un territorio sempre più affollato da contenuti creati automaticamente, ma un nuovo studio mostra per la prima volta un sorpasso che sembrava impossibile. Secondo una recente analisi condotta da Graphite, oltre il 50% degli articoli presenti online a novembre 2024 non è stato scritto da persone, ma prodotto dall’intelligenza artificiale. È un punto di svolta nella storia del Web, un momento in cui, anche solo per un breve periodo, le macchine hanno superato gli autori umani nella quantità di testi pubblicati.
La ricerca ha esaminato 65.000 articoli in lingua inglese presenti nell’archivio open source Common Crawl, rivelando una crescita vertiginosa dei contenuti automatizzati a partire dal lancio di ChatGPT, nel novembre 2022. In soli dodici mesi, la scrittura generata da AI è passata dal rappresentare una minoranza a sfiorare il 39% del totale, fino al sorpasso temporaneo registrato a fine 2024. Un trend rapido, che però si è stabilizzato nel corso del 2025, riportando gli articoli AI e quelli umani su valori più equilibrati.
Un elemento sorprendente dello studio è che, nonostante la massiccia presenza di testi creati artificialmente, questi non dominano affatto i motori di ricerca. Secondo Graphite, oltre l’80% dei contenuti mostrati da Google e dagli assistenti conversazionali – tra cui ChatGPT e Perplexity – provengono ancora da articoli scritti da persone. Non è quindi un takeover totale, ma un sistema misto in cui l’AI produce molto, ma non viene premiata con altrettanta visibilità.

Lo studio di Graphite: come è stato condotto e perché i ricercatori lo ritengono affidabile
Per distinguere i contenuti umani da quelli generati dall’AI, i ricercatori hanno utilizzato un rilevatore sviluppato da SurferSEO, uno strumento capace di analizzare blocchi di testo da 500 parole e assegnare una probabilità che siano stati creati da un modello linguistico. Un articolo viene classificato come “artificiale” quando più del 50% del testo è prodotto da un’AI.
Prima di applicare questa metodologia, Graphite ha verificato l’affidabilità dello strumento, calcolando il tasso di errore. I risultati mostrano un 4,2% di falsi positivi, testando articoli scritti prima dell’era ChatGPT, e solo lo 0,6% di falsi negativi su testi creati da GPT-4o, uno dei modelli più avanzati dell’epoca considerata nello studio. In totale, la precisione del rilevatore ha raggiunto il 99,4%, un dato che i ricercatori considerano altamente indicativo.
Dai grafici emerge con chiarezza l’esplosione dei contenuti automatizzati dopo il 2022. Il sorpasso dell’AI sugli autori umani, registrato nel novembre 2024, è durato poco: già all’inizio del 2025 la situazione si è riequilibrata. Per gli esperti questo può dipendere dal fatto che i testi generati dall’AI hanno performance scarse nei motori di ricerca, che continuano a favorire contenuti più naturali e considerati più affidabili.
Un secondo studio condotto dalla stessa Graphite mostra che l’86% degli articoli presenti su Google è di origine umana, mentre solo il 14% deriva da sistemi di intelligenza artificiale. Una proporzione quasi identica emerge anche dai principali chatbot, che continuano a citare soprattutto fonti scritte da persone.
I limiti della ricerca e cosa ci dice davvero sul futuro dell’informazione online
Gli stessi autori dello studio riconoscono alcuni limiti inevitabili. Il database Common Crawl, da cui sono stati estratti gli articoli, non rappresenta l’intero Web: non include infatti contenuti a pagamento o articoli pubblicati su siti che impediscono l’indicizzazione. Questo significa che la percentuale di testi umani potrebbe essere in realtà più alta.
Inoltre, distinguere tra testi scritti interamente dall’AI e testi generati ma poi rielaborati dagli editor è sempre più complesso, soprattutto considerando che i modelli linguistici migliorano rapidamente e diventano meno riconoscibili. Con il tempo, individuare con precisione l’origine di un contenuto potrebbe diventare ancora più difficile.
Nonostante questi limiti, lo studio di Graphite racconta un cambiamento in corso: l’AI non ha preso il controllo dell’informazione, ma ha cambiato gli equilibri, producendo un volume di contenuti enorme, anche se non sempre destinato a emergere sui motori di ricerca o nelle risposte dei chatbot. È l’immagine di un Web ibrido, dove la scrittura umana e quella artificiale convivono, si intrecciano e si influenzano a vicenda, dando vita a un ecosistema di informazioni che non è più possibile leggere come “solo umano” o “solo digitale”.






