All’Università di Chicago un team di ricercatori ha scoperto degli algoritmi di copia vocale talmente avanzati al punto di ingannare i dispositivi di riconoscimento vocale.
Gli algoritmi al momento sono due, SV2TTS e AutoVC, e sono stati testati ottenendo campioni di registrazioni vocali da database pubblicamente disponibili. Entrambi i sistemi sono stati addestrati utilizzando 90 frammenti vocali di cinque minuti di persone che parlano.
Hanno anche richiesto l’assistenza di 14 volontari che hanno fornito campioni vocali e accesso ai loro dispositivi di riconoscimento vocale. I ricercatori hanno quindi testato i due sistemi utilizzando il software open source Resemblyzer che ascolta e confronta le registrazioni vocali e fornisce una valutazione basata su due campioni simili.
I ricercatori hanno scoperto che questi algoritmi sono in grado di ingannare il Resemblyzer quasi la metà delle volte. Hanno anche scoperto di essere in grado di ingannare Azure (il servizio di cloud computing di Microsoft) circa il 30 percento delle volte.
Sono stati in grado di ingannare il sistema di riconoscimento vocale Alexa di Amazon circa il 62% delle volte
Duecento volontari hanno anche ascoltato coppie di registrazioni cercando di determinare se le voci provenissero dalla stessa persona – i risultati sono stati contrastanti, ma nel complesso, gli algoritmi sono stati in grado di ingannare i volontari il più delle volte – e soprattutto quando le voci campionate erano di personaggi famosi.