
Le odierne intelligenze artificiali sono abbastanza abili nel comprendere cosa una singola voce sta dicendo tanto che le più sopraffini di esse riescono anche a riconoscere il tono della voce e dunque l’utente che ha emesso il suono.
Tuttavia gli stessi computer hanno enormi difficoltà nel riconoscere una singola voce in mezzo a tante: si immagini, per esempio, il chiacchiericcio ad una festa. Un umano è capace di comprendere cosa il suo interlocutore sta dicendo anche in mezzo a decine di persone che stanno chiacchierando all’unisono, cosa attualmente impossibile per un’intelligenza artificiale.
Una nuova tecnologia, sviluppata dagli scienziati del Mitsubishi Electric Research Laboratory di Cambridge, Massachusetts, infonde però nuove speranze per quanto riguarda lo sviluppo futuro di intelligenza artificiale che possa discernere una singola voce in mezzo a tante altre.
Utilizzando una tecnica di apprendimento automatico, il software riesce ad identificare caratteristiche uniche da fonti multiple e a disattivare ognuna di esse con il fine di riconoscerne solo una.
Al momento il sistema riconosce il discorso di due persone, distinguendole, che parlano con un solo microfono con una precisione del 90%.
Si tratta di una ricerca che potrebbe rivelarsi altamente utile per quanto riguarda uno sviluppo ancora migliore dei dispositivi che lavorano essenzialmente con la voce (si pensi, per esempio, a Google Home oppure all’Echo di Amazon).