I progetti Aloud e Relate di Google: quando la tecnologia abbatte le barriere

L'intelligenza artificiale è pericolosa? No, pericoloso è il modo in cui potrebbe essere utilizzata. Oggi scopriamo Aloud e Relate: due progetti di Google in cui la tecnologia viene messa al servizio dell'abbattimento delle barriere linguistiche.

I progetti Aloud e Relate di Google: quando la tecnologia abbatte le barriere
I progetti Aloud e Relate di Google: quando la tecnologia abbatte le barriere

L'intelligenza artificiale, e la tecnologia in generale, sono dei mezzi potenti, e sta a noi convogliarli verso il bene.

"L'intelligenza artificiale sarà la cosa migliore o peggiore mai successa all'umanità".
- Stephen Hawking -

Il grande Stephen Hawking si è espresso più volte sulla pericolosità dell'intelligenza artificiale, ma la vera minaccia è nel tipo di utilizzo al quale verrà destinata.

Se sceglieremo di usare il coltello per sbucciare le mele e non per commettere dei delitti, tutto andrà per il meglio.

In questo post, vorrei raccontare due progetti in cui l'intelligenza artificiale viene utilizzata per un fine che definirei emozionante, ovvero l'eliminazione delle barriere linguistiche, ma in due diverse interpretazioni di "barriera". Mi riferisco ai progetti Aloud e Relate di Google.

Il progetto Aloud

Aloud è un nuovo progetto di Area 120, il noto incubatore di Google dedicato alla sperimentazione. Utilizzando Aloud, i creator possono doppiare rapidamente e facilmente i loro video in più lingue, permettendo di liberare una conoscenza che rischierebbe di rimanere "intrappolata" in una singola lingua.

Hai mai desiderato imparare qualcosa da un video, ma non ci sei riuscito/a perché era in un'altra lingua? Se la tua risposta è sì, non sei solo/a.
Il video di presentazione di Aloud

Secondo una ricerca di Google, il 46% degli utenti usa i video per apprendere nuove nozioni. Tuttavia, la maggior parte dei contenuti viene prodotto in inglese, ma oltre l'80% della popolazione mondiale non lo parla.

Si potrebbe pensare ai sottotitoli possano come buon compromesso. Di certo possono aiutare a colmare il divario linguistico, ma non sono sempre ideali sui dispositivi mobili a causa dei seguenti fattori:

  • le dimensioni dei display,
  • la necessità di un'attenzione costante verso lo schermo,
  • la difficoltà di accessibilità per chi ha problemi di vista o di lettura.

Il doppiaggio, ovvero l'inserimento di una traccia vocale tradotta, supera questi limiti, ma con due problematiche: richiederebbe tempo e avrebbe costi proibitivi per la maggior parte dei creator.

Con Aloud, il doppiaggio può essere facile come digitare testo nella tua lingua. Anzi, di più..
Un esempio dell'esperienza di doppiaggio nell'interfaccia di Aloud
Un esempio dell'esperienza di doppiaggio nell'interfaccia di Aloud - Fonte: blog.google

Con Aloud, per creare il doppiaggio di un video informativo, bastano pochi minuti. Le tecnologie coinvolte sono la separazione dell'audio dal video, la traduzione automatica, la sintesi vocale e il video editing. Non è necessario conoscere una lingua diversa.. e l'obiettivo è quello di mettere a disposizione il servizio gratuitamente.

E quali sono gli "ingredienti" dai quali partire? Semplicemente il video e i sottotitoli nella lingua originale. Se i sottotitoli non sono disponibili, è possibile utilizzare la trascrizione automatica come base di partenza da editare dove serve.

Un esempio di video doppiato con Aloud

Quello che segue è il video di partenza, generato in lingua inglese.

La versione originale di video in lingua inglese

Utilizzando Aloud,  è possibile ottenere un lo stesso video doppiato, ad esempio, in hindi.

Lo stesso video doppiato automaticamente in hindi con Aloud

Cliccando qui, invece, si può vedere un video doppiato automaticamente in spagnolo (questo è l'originale), e un altro in portoghese (a partire da questo).

Grazie a questa nuova opportunità, sarà possibile raggiungere porzioni della popolazione mondiale precedentemente irraggiungibili. Google afferma che dagli esperimenti effettuati sono state rilevate crescite in doppia cifra delle visualizzazioni semplicemente doppiando in una lingua aggiuntiva.

Il progetto Relate

Si tratta di una nuova applicazione Android che mira ad aiutare le persone con problemi di linguaggio a comunicare più facilmente e ad interagire con Google Assistant.
Project Relate è la continuazione di anni di ricerca da parte dei team di ricerca di Google che hanno lavorato su oltre un milione di campioni vocali.

Per milioni di persone, essere in grado di parlare ed essere capiti può essere difficile a causa di condizioni che impattano sul linguaggio, tra cui ictus, SLA, paralisi cerebrale, trauma cranico o morbo di Parkinson.
Project Relate di Google: come funziona?

Come funziona?

Agli utenti tester di Project Relate, viene chiesto di registrare una serie di frasi. L'applicazione utilizza questi dati per imparare automaticamente a comprendere gli schemi vocali unici che caratterizzano ognuno, e dà accesso alle tre funzionalità principali del sistema: Ascolto, Ripetizione e Assistente.

Ascolto. Attraverso la funzione "Ascolta", l'applicazione trascrive le frasi in real-time, così da poter copiare ed incollare il testo in altre applicazioni, oppure farlo leggere ad altre persone.

Ripetizione. La funzione "Ripeti" può ribadire quello che dice una persona utilizzando una voce sintetica molto chiara. Un esempio di utilizzo può essere la conversazione faccia a faccia o i comandi vocali destinati all'ambient computing.

Assistente. L'applicazione Relate comunica direttamente con Google Assistant, per ottenere funzionalità in modo molto semplice.

Nella creazione dell'applicazione, il team di sviluppo ha lavorato a stretto contatto con molte persone con problemi di linguaggio, tra cui Aubrie Lee, brand manager di Google, affetta da distrofia muscolare.

“I’m used to the look on people’s faces when they can’t understand what I’ve said. Project Relate can make the difference between a look of confusion and a friendly laugh of recognition”
- Aubrie Lee -

Il nome stesso del progetto è una sua idea.

Conclusioni

Sono profondamente d'accordo con Stephen Hawking: abbiamo a disposizione una tecnologia potente e dobbiamo scegliere bene.
Questi progetti, per me, sono un sinonimo di "scegliere bene", e vorrei poterne condividere tutti i giorni.

Immaginiamo un mondo senza barriere di linguaggio, dove tutti possono essere compresi da chiunque sia in ascolto e dove tutti possono comprendere chiunque si stia esprimendo. Non è emozionante!?

Non solo Google sta lavorando verso queste direzioni. Recentemente, Meta ha annunciato il suo progetto di traduttore universale istantaneo basato sull'intelligenza artificiale.

La capacità di comunicare con chiunque in qualsiasi lingua è un superpotere che le persone hanno sempre sognato e l'AI lo permetterà.
- Mark Zuckerberg, CEO di Meta -

Questo significa che non si dovranno più studiare le lingue? Assolutamente no, ma credo sia un rischio accettabile per giungere ad un fine (a mio parere) superiore.


Per approfondire

Overcoming the language barrier in videos with Aloud
Announcing Aloud, an easy and cost effective video dubbing solution that brings us one step closer towards overcoming the language barrier.
Aloud - dubbing for everyone
Get a quality dub in minutes
A communication tool for people with speech impairments
Project Relate, a new app available in closed beta, helps people with speech impairments communicate and interact with Google Assistant.
L’AI spaventa perché non è semplice da comprendere.. ma cosa c’è da temere?
Spesso immaginando scenari visti in film come “Terminator” o “2001: Odissea nello spazio” possiamo essere spaventati dalla crescita dell’AI. Ma è dell’intelligenza artificiale che dobbiamo essere spaventati? Scopriamolo!