
Uno studio pubblicato su Nature[1] presenta una tecnologia in grado di imitare l’elaborazione uditiva biologica per il riconoscimento vocale, combinando due innovativi sistemi hardware: dopant network processing unit (DNPU) e computing in-memory analogico (AIMC).
Un sistema ispirato alla coclea umana
L’orecchio umano riesce a scomporre suoni complessi in frequenze e impulsi elettrici grazie alla coclea. Gli autori del nuovo studio hanno tentato di replicare questo processo con dispositivi al silicio. I DNPUs riescono a emulare le funzioni della coclea grazie alla loro non linearità e memoria a breve termine, traducendo i segnali acustici in segnali elaborabili da un sistema neurale artificiale.
Nuovo approccio all’elaborazione vocale
L’architettura proposta permette di elaborare direttamente i segnali audio grezzi, senza bisogno di conversioni costose da analogico a digitale o trasformate di Fourier. Il sistema sfrutta i DNPUs per estrarre le caratteristiche principali della voce e un chip AIMC per classificarle, ottenendo un’efficienza energetica molto superiore ai metodi digitali convenzionali.
Prestazioni simili al software ma con meno risorse
Test effettuati su dataset vocali noti hanno mostrato un’accuratezza del 96,2% nel riconoscimento di cifre parlate e dell’89,3% per comandi vocali. Ciò è stato ottenuto usando una frazione minima dell’energia normalmente necessaria. Il sistema AIMC riduce i consumi grazie all’elaborazione diretta nella memoria, eliminando i limiti architetturali tradizionali.
Verso un futuro di elaborazione edge sostenibile
Nonostante DNPU e AIMC siano ancora fisicamente separati, il team prevede un’integrazione su un unico chip. La scalabilità e l’efficienza di questa tecnologia potrebbero rivoluzionare il riconoscimento vocale su dispositivi compatti, aprendo la strada ad applicazioni nel campo sanitario, della guida autonoma e dell’Internet of Things.


