Baidu realizza software clonatore di voci utilizzando rete neurale

Baidu ha annunciato un ulteriore sviluppo riguardo al suo software per il riconoscimento vocale. Il nuovo programma risulterebbe in grado di clonare le voci dopo aver analizzato una clip audio, qualcosa di non nuovo nel panorama dei programmi audio. Tuttavia la novità questa volta sta nella lunghezza della clip da analizzare che, secondo Baidu, può anche essere lunga solo un secondo.
Il software utilizza una rete neurale e dunque una sorta di intelligenza artificiale per analizzare l’audio. Oltre a clonare la voce, può anche cambiarla (ad esempio per applicare un accento diverso).

I progressi nel campo dei programmi di riconoscimento vocale e soprattutto di quelli che vanno a coronare le voci stanno facendo passi da gigante negli ultimi anni, segno del fatto che le possibilità computazionali delle nuove reti computerizzate sono sempre più alte.
Diversi sample audio realizzato con Possono essere trovati qui.

Fonti e approfondimenti



Condividi questo articolo

Resta aggiornato su Facebook: clicca su “Mi piace questa pagina”


Commenta per primo

Rispondi