L’intelligenza artificiale ha fatto un enorme passo avanti nella genomica con l’introduzione di GROVER, un nuovo modello linguistico di grandi dimensioni che tratta il DNA come un linguaggio. Secondo un articolo pubblicato su Nature Machine Intelligence, [1] scienziati del Centro di biotecnologia della Dresden University of Technology hanno sviluppato questo modello per analizzare le vaste e complesse informazioni immagazzinate nel DNA umano.
Applicando tecniche di intelligenza artificiale comunemente utilizzate nell’elaborazione del linguaggio naturale, i ricercatori sono ora in grado di decifrare gli strati nascosti di informazioni all’interno del nostro codice genetico, offrendo nuove intuizioni sia sulla biologia di base che sulla medicina personalizzata.
Il DNA come linguaggio
Il concetto alla base di GROVER è semplice ma rivoluzionario: trattare il DNA come un testo, con le sue regole e la sua struttura. Anna Poetsch, che dirige il gruppo di ricerca presso il BIOTEC, spiega che gran parte del genoma umano non codifica per le proteine e la sua funzione rimane misteriosa. GROVER, imparando la “grammatica” e la “sintassi” del DNA, può predire ed estrarre significati biologici da queste regioni non codificanti. Il modello ha dimostrato la sua capacità di predire accuratamente le sequenze di DNA e identificare elementi funzionali, come i promotori genici e i siti di legame proteico.
Implicazioni per la genomica e la medicina
Le potenziali applicazioni di GROVER sono vaste. Imparando le regole che governano le sequenze di DNA, il modello può rivelare come le informazioni genetiche sono organizzate e utilizzate nel corpo. Melissa Sanabria, una ricercatrice del progetto, nota che questo approccio ha persino permesso loro di scoprire informazioni epigenetiche, processi regolatori che si verificano in cima alla sequenza di DNA stessa.
Lo sviluppo di GROVER potrebbe rivoluzionare il campo della genomica, fornendo nuovi modi per interpretare i dati genetici, il che potrebbe portare a progressi nella medicina personalizzata. Con questo strumento, i ricercatori sono un passo più vicini a sbloccare il pieno potenziale del genoma umano.