ISCRIVITI ALLA NEWSLETTER

giovedì 18 luglio 2019

Il Colosso Cinese Baidu Sviluppa Un Sistema Artificiale Per Clonare Qualsiasi Voce In Pochi Secondi


Come imitare una voce? 
I ricercatori di Baidu hanno creato un'intelligenza artificiale che, sostengono, addirittura, può clonare la tua voce in meno di un minuto. 
Altro che imitare la voce di qualcuno, quindi, vorrebbe dire riprodurla uguale identica.

Deep Voice è un sistema di sintesi vocale che Baidu ha preparato utilizzando 800 ore di audio da 2.400 altoparlanti. Sebbene il sistema in genere necessiti di 100 sezioni di allenamento vocale da 5 secondi per imitare una voce, un campione di 5-10 secondi è stato sufficiente a ingannare un sistema di riconoscimento vocale più del 95% delle volte.




Deep Voice è in grado di generare nuovi discorsi, accenti, toni e stili. Ad esempio, è in grado di trasformare una voce femminile in maschile e un accento britannico in uno americano. 

"Da un punto di vista tecnico, questo è un importante passo avanti che mostra che un complicato problema di modellizzazione generativa, vale a dire sintesi vocale, può essere adattato a nuovi casi apprendendo in modo efficiente solo da alcuni esempi" dice Leo Zou, un membro del team di comunicazione di Baidu. 

"In precedenza, occorrevano numerosi esempi per un modello da apprendere. Ora, è sufficiente una frazione di quello che era solito fare".



"Vediamo molti ottimi casi d'uso o applicazioni per questa tecnologia", ha detto Zou. 

"Ad esempio, la clonazione vocale potrebbe aiutare i pazienti che hanno perso la voce. Questo è anche un importante passo avanti nella direzione delle interfacce uomo-macchina personalizzate. Ad esempio, una mamma può facilmente configurare un lettore di audiolibri con la propria voce. Il metodo [in aggiunta] consente la creazione di contenuti digitali originali. Centinaia di personaggi in un videogioco potrebbero avere voci uniche a causa di questa tecnologia. Un'altra interessante applicazione è la traduzione linguistica da voce a voce, poiché il sintetizzatore può imparare a imitare l'identità dell'altoparlante in un'altra lingua. "






Tecnologie come Deep Voice rappresentano il rapido progresso nell'apprendimento automatico. Tuttavia, alcuni sono preoccupati che il sistema possa essere utilizzato e abusato per fabbricare interviste, segmenti di notizie e conferenze stampa. Con la preoccupazione che questa nuova tecnologia di cloni porti a notizie ancora più false, speriamo che non finisca nelle mani sbagliate, dato che per adesso il massimo che si può fare è riuscire a capire come imitare una voce, e non clonarla del tutto.








Mi chiamo Luca, creatore del blog Siamo Vita. Penso che fondere psicologia e spiritualità possa aiutarti a creare una vita più felice. 
Ricevi una copia gratuita del mio eBook di 31 pagine - Segreti Per Controllare La Tua Vita Tra Psicologia E Spiritualità - cliccando qui.



 


Nessun commento:

Posta un commento

Il tuo commento è molto ben accetto su questo blog, ogni opinione è gradita ed il confronto aiuta sempre, perciò ti invito a commentare, ma tieni conto di questi semplici accorgimenti:

1. Vengono accettati solo commenti utili, interessanti e ricchi di contenuto.
2. Non linkare il tuo sito o servizio per farti pubblicità, non servirebbe, i link sono tutti no_follow e comunque il commento non verrebbe pubblicato.
3. Se il commento è offensivo non verrà pubblicato. Siamo qui per dialogare e non per insultare :)