Un nuovo articolo su The Conversation prende in esame un nuovo studio scientifico apparso recentemente su Nature. Questo studio afferma che un algoritmo basato sull’intelligenza artificiale può prevedere future scoperte scientifiche estraendo i dati da articoli scientifici già pubblicati.
In particolare sarebbe il cosiddetto Natural Language Processing (NLP), che rappresenta una delle tante tecniche di machine learning esistenti, a poter valutare i dati e le informazioni dalla letteratura scientifica e a poter estrarre altre informazioni attraverso un apprendimento sostanzialmente non supervisionato.
Questo significa che lo stesso algoritmo può migliorarsi da solo a seconda della quantità di dati che riesce ad analizzare.
I ricercatori dietro questo nuovo studio hanno utilizzato complesse proprietà statistiche e geometriche dei dati facendo sì che l’algoritmo potesse identificare da solo nomi, concetti e strutture chimiche.
Per fare ciò hanno dato in pasto all’algoritmo 1,5 milioni di abstract di articoli scientifici riguardanti la scienza dei materiali.
L’algoritmo di apprendimento automatico ha classificato le parole e le ha collegate ad altre a seconda della loro frequenza e della loro vicinanza nei testi.
Questo metodo, secondo gli stessi ricercatori che hanno pubblicato lo studio, potrebbe essere utilizzato per “catturare” relazioni più complesse e identificare informazioni non identificabili da una mente umana per la mole dei dati troppo estesa.
Nel contesto della scienza dei materiali, per esempio, un’intelligenza artificiale, dopo questo processo di apprendimento, potrebbe essere capace di raccomandare determinati materiali per determinate applicazioni anni prima che avvenga la scoperta.
Ciò suggerisce due cose: che un buon livello di “conoscenza latente” è già incorporata nelle pubblicazioni passate e che un’intelligenza artificiale adeguatamente addestrata con un quantitativo sufficiente di dati può estrarre tale conoscenza e renderla subito disponibile.