Le voci sintetiche di MateDub: intervista a Simone Perone

Con Simone Perone, parliamo di voci artificiali generate dall'intelligenza artificiale, del progetto MateDub, di assistenti virtuali e di come saranno le traduzioni simultanee nel futuro.

Le voci sintetiche di MateDub: intervista a Simone Perone
Le voci sintetiche di MateDub: intervista a Simone Perone

Un nuovo episodio di Voice Technology con Simone Perone, con il quale parliamo di voci artificiali generate attraverso l'intelligenza artificiale, del progetto MateDub, di assistenti virtuali e di come saranno le traduzioni simultanee nel futuro.

Chi è Simone Perone?

Simone Perone è VP of Product Management di Translated, e si occupa anche del progetto MateDub.

Simone Perone, VP of Product Management di Translated
Simone Perone, VP of Product Management di Translated
Utilizziamo la tecnologia per migliorare le prestazioni degli esseri umani, non per sostituirli, quindi la applichiamo sia a supporto dei workflow interni di lavorazione delle traduzioni, sia nel processo di traduzione del traduttore stesso, fornendo dei tool che velocizzando il lavoro.

Il podcast completo e la video intervista

Quello che segue è l'episodio podcast completo, con all'interno la parte video dell'intervista.

L'intervista completa a Simone Perone

I punti salienti

00:55 Presentazione di Simone Perone
01:29 Cos'è MateDub e com'è nato il progetto
04:53 Come vengono clonate le voci?
06:49 Un esempio di voce clonata
07:24 Quanto può essere espressiva una voce clonata?
08:32 Come vengono tutelati i doppiatori (questione etica)
11:48 Un marketplace per le voci: come funziona?
13:25 Come verranno gestiti i “deepfake”?
14:48 Audio Branding e Voice Branding
16:43 Il futuro delle voci sintetiche
19:24 Take Away

La nostra idea a medio termine è quella di creare un marketplace delle voci. Quindi daremo la possibilità a tutti di contribuire registrando la propria voce, lasciando, in tutto il processo, il controllo completo al proprietario.
Alessio Pomaro intervista Simone Perone
Alessio Pomaro intervista Simone Perone

Take Away

Un piccolo riepilogo dei concetti emersi nell'episodio.

  • MateDub è un progetto di Translated, che circa 5 anni fa ha iniziato ad interessarsi al mondo audiovisual. Il progetto si basa sul paradigma "human in the loop": la macchina produce un output, l’umano interviene, e le correzioni vengono usate per migliorare le performance.
  • MateDub basa la sua azione su reti neurali, deep neural network, e la clonazione della voce avviene attraverso il training di modelli di machine learning, che prevede la registrazione di un paio d’ore di parlato in studio di registrazione. A livello tecnico, come algoritmo di base abbiamo Tacotron 2 di Google, ma in ricerca e sviluppo ci sono nuovi studi.
  • La gamma di espressioni della voce dipende dal training. Può essere riprodotta praticamente qualunque sfumatura.
  • Il progetto prevede la creazione di un marketplace, attraverso il quale, chi lo desidera può clonare la voce e metterla a disposizione. Chi ne ha bisogno, attraverso la piattaforma, potrà contattare il doppiatore ed avviare un processo di proposta/valutazione/accordo. Il proprietario della voce rimane al centro, e mantiene il controllo, su tutti i piani.
  • L’obiettivo non è sostituire i doppiatori, ma creare delle opportunità. Se, ad esempio, avessimo migliaia di contenuti da registrare per delle guide turistiche, considerando i turni di registrazione, i tempi si allungherebbero a dismisura. Grazie alla tecnologia, registrando 2 ore, "il gioco è fatto".
  • Tecnologie basate su blockchain possono essere una risposta per certificare l’autenticità delle voci e quindi combattere problematiche come il deepfake.
  • Il futuro delle voci sintetiche? Sistemi di traduzioni automatiche che abbatteranno le barriere comunicative a livello mondiale.

Avremo una "machine translation" automatica e disponibile ad un prezzo basso, se non gratuito, per tutti. Questo rispecchia la nostra mission che si può riassumere in "Understand and get understood", quindi "comprendere e farsi comprendere". Fra dieci anni speriamo di aver risolto il problema della comunicazione mondiale perché fondamentalmente credo che se prima non impariamo a comunicare non possiamo risolvere qualsiasi altro tipo di problema.

Per approfondire

Clonazione della voce? Il progetto MateDub!
Cos’è MateDub? Uno strumento per fare doppiaggio utilizzando voci prodotte da un’intelligenza artificiale allenata ascoltando i migliori doppiatori. Scopri i dettagli!
Matedub | Create high quality voice-over projects in minutes, not weeks.
Dub videos by simply editing the text.