![Su internet si trovano decine di siti che permettono di a clonare una voce partendo anche da campioni audio di pochissimi secondi Su internet si trovano decine di siti che permettono di a clonare una voce partendo anche da campioni audio di pochissimi secondi](https://www.quotidiano.net/image-service/view/acePublic/alias/contentid/Nzg0NjBkN2ItMjRkMC00/0/su-internet-si-trovano-decine-di-siti-che-permettono-di-a-clonare-una-voce-partendo-anche-da-campioni-audio-di-pochissimi-secondi.webp?f=16%3A9&q=1&w=1280)
Su internet si trovano decine di siti che permettono di a clonare una voce partendo anche da campioni audio di pochissimi secondi
Milano – Negli ultimi anni, la tecnologia di clonazione vocale basata sull’intelligenza artificiale ha compiuto progressi significativi, consentendo la replica di voci umane con un realismo sorprendente. Questa innovazione sta sollevando preoccupazioni riguardo all’uso improprio e alla possibilità di ingannare chi ascolta, come accaduto nella recente truffa ai danni di diversi imprenditori italiani, contattati da quello che pensavano essere il ministro della Difesa Guido Crosetto – la cui voce era replicata – per ottenere ingenti somme di denaro.
I programmi per clonare la voce
Su internet si trovano decine di siti che permettono di a clonare una voce partendo anche da campioni audio di pochissimi secondi: può bastare un semplice breve messaggio vocale di WhatsApp oppure, nel caso di personalità note, una dichiarazione pubblica. Questi strumenti – se ne trovano di gratuiti e a pagamento – sono piuttosto semplici da usare e permettono di creare una frase parlata in pochi secondi.
Speechify Voice Cloning, ad esempio, utilizza algoritmi avanzati di deep learning per creare cloni vocali dal suono naturale. È sufficiente registrare una voce per 30 secondi, dopodiché è possibile generare voiceover con la voce sintetica clonata, regolando emozioni, pronunce, pause e tono.
Resemble.ai offre la possibilità di creare voci personalizzate per assistenti virtuali come Alexa e Google Assistant. Integra la voce sintetica in vari contesti, inclusi giochi e applicazioni commerciali.
Veed.Io consente di registrare una voce, digitare un testo e generare una voce fuori campo che replica fedelmente il profilo vocale dell'utente. È particolarmente utile per creare contenuti video con narrazioni personalizzate.
Vidnoz AI Voice Changer invece contiene oltre 100 voci preimpostate e supporta più di 140 lingue. Permette di clonare voci di personaggi famosi o di utilizzare la propria voce per creare contenuti multilingue.
Difendersi con la tecnologia
La capacità di distinguere tra una voce reale e una clonata è fondamentale per prevenire frodi. Sebbene le voci sintetiche siano sempre più convincenti, esistono dei metodi tecnologici per rilevare l’inganno. C’è innanzitutto l’analisi delle caratteristiche vocali: le voci sintetiche possono presentare anomalie nell'intonazione, nel ritmo o nella pronuncia. Ci sono strumenti di rilevamento basati sulla stessa intelligenza artificiale: sono stati sviluppati algoritmi specifici per identificare voci generate artificialmente. DeepSonar, ad esempio, monitora i comportamenti dei neuroni in un sistema di riconoscimento vocale per discernere le voci sintetiche da quelle reali.
Difendersi con le domande
Ma per evitare di essere ingannati da una voce clonata con l’intelligenza artificiale, si possono porre domande mirate alla persona che dovrebbe essere dietro la voce. Le intelligenze artificiali vocali possono riprodurre il tono e il modo di parlare di una persona, ma non hanno accesso ai suoi ricordi o esperienze personali. Quindi si chiedere qualcosa come: “Dove ci siamo visti l’ultima volta?” oppure “Ti ricordi come si chiama mio figlio?”. Se la voce clonata non può rispondere correttamente o tergiversa, è un segnale di allarme.
Un’altra tecnica è interrompere e fare domande a sorpresa. Le voci sintetiche sono spesso basate su modelli pre-registrati o generati in tempo reale con piccoli ritardi. Interrompere la persona mentre parla e vedere se risponde in modo naturale può smascherare l’inganno. Infine, i modelli di intelligenza artificiale vocale possono avere difficoltà con parole dialettali o modi di dire particolari: nel dubbio, insomma, se l’interlocutore è milanese si può chiedere di parlare in meneghino.