NON NATURALE MA ARTIFICIALE

Un’analisi svolta dal ricercatore Filippo Lubrano ha dimostrato che i modelli linguistici dell’Intelligenza Artificiale tendono ad avere una cadenza ricorrente che smaschera subito l’artificialità del testo. Questa figura retorica si chiama epanortosi enfatica e prevede la ripetizione della formula “non X, ma Y”.

Nei documenti scritti dagli esseri umani questo artificio ha la funzionalità di ribaltare un’aspettativa, di introdurre un colpo di scena retorico o di intensificare un pensiero, ma nei testi generati dall’AI diventa una ripetizione quasi ossessiva. Dalla ricerca di Lubrano è emerso che ogni 1000 frasi si possono contare 27 occorrenze di questo tipo nei testi generati da ChatGPT, contro le 5 presenti nei testi umani.

L’epanortosi, essendo così frequente nei testi generati da ChatGPT, è un ottimo predittore del fatto che il testo che abbiamo davanti agli occhi sia frutto dell’Intelligenza Artificiale. Se la frequenza di questo espediente retorico cresce infatti oltre una certa soglia, è facile ipotizzare che quel contenuto non sia stato generato da un umano.

Nei dataset che alimentano gli LLM, casi di epanortosi sono riscontrabili 9 volte su 1000, cifra significativamente inferiore di quella che invece troviamo poi nel testo generato. Com’è possibile che ci sia una differenza così ampia? Lubrano spiega che le formule di negazione seguita dal rilancio positivo che si trovano nei dataset sono tipiche di settori quali marketing e comunicazione politica, che mirano ad essere persuasivi e memorabili. A questo si aggiunge il fatto che coloro che sono incaricati di valutare la qualità delle risposte generate dall’AI tendono a premiare quei segmenti linguistici percepiti come rafforzativi e chiari. Ecco quindi che l’epanortosi viene rafforzata proprio nel momento del training, in un processo definito sloganoid effect: una chiarezza di linguaggio solo apparente che non fa altro che ridurre la varietà di significati

Uno dei problemi principali di questo training erroneo è il suo continuo autoalimentarsi: gli utenti che leggono testi in cui sono presenti numerosi casi di epanortosi tendono a interiorizzare il fenomeno e usarlo a loro volta nei testi che pubblicano sul web, che vengono poi impiegati in nuovi dataset.

Tra le strategie proposte per evitare un appiattimento della lingua, c’è quella di inserire nei dataset più testi che usano forme diverse di enfasi, penalizzare la ripetizione degli schemi ricorrenti e spingere coloro che scrivono i prompt a chiedere esplicitamente soluzioni alternative.

 

S.B.


Diritto dell’informazione

“Diritto dell’informazione: la bussola per orientarsi tra notizie e giurisprudenza.”

Continua a seguirci!

▶️ https://dirittodellinformazione.it/chi-siamo/