Nuovo algoritmo aiuta a capire se un testo è stato scritto da una macchina

Un nuovo strumento informatico che utilizza gli algoritmi dell’intelligenza artificiale per aiutare a capire se un testo è stato prodotto proprio da un’intelligenza artificiale: è il software realizzato da un gruppo di ricercatori dell’Università di Harvard e del WITon AI Lab del MIT-IBM.
I ricercatori hanno denominato il nuovo software Giant Language Model Test Room (GLTR).

In effetti ricorrere alle intelligenza artificiale per capire se un testo è stato realizzato da un algoritmo piuttosto che da un essere umano potrebbe essere davvero l’ultima speranza per contrastare quello che già viene definito come lo tsunami IA che dovrebbe abbattersi su Internet nei prossimi anni.

Si prevede, infatti, che nel corso dei prossimi anni i software di realizzazione di testo possano migliorare a tal punto che saranno in grado di scrivere del testo corretto sotto il profilo grammaticale e sintattico, oltre che concettuale. Risulterà sostanzialmente impossibile capire se è stato scritto da un essere umano o no.

I ricercatori hanno utilizzato il classico metodo del machine learning: hanno alimentato il proprio algoritmo con quantità enormi di testo creando un modello enorme di apprendimento automatico. Quest’ultimo è basato sugli schemi statistici delle parole.
In sostanza individua quali parole hanno una probabilità statistica più alta o più bassa di apparire dopo una parola o una frase precedente nel testo.

I periodi e le frasi dei testi scritti dagli esseri umani sono per certi versi abbastanza prevedibili: usiamo spesso gli stessi costrutti sintattici e sempre più spesso facciamo ricorso alle classiche “frasi fatte” o ad espressioni di uso comune per esprimere un concetto.
Basandosi su questo, i ricercatori sono riusciti a creare un algoritmo basato sulla lingua inglese che evidenzia le parole più prevedibili in verde, quelle meno prevedibili in giallo o in rosso e quelle ancor meno prevedibili in viola.

I ricercatori hanno poi chiesto ad alcuni studenti di individuare quali erano per loro i testi scritti da un’intelligenza artificiale oppure da esseri umani con l’aiuto di questa evidenziazione oppure senza. Nel primo caso riuscivano ad individuare la paternità dei testi nel 72% dei casi, nel secondo caso solo nel 50% dei casi.

Approfondimenti

Articoli correlati

Condividi questo articolo

Dati articolo


Resta aggiornato su Facebook