Future Mirror – La nuova frontiera del Voice Cloning

Il Voice Cloning ha diversi campi di applicazione, dalla creazione di audiolibri alle tecnologie mediche per le persone con difficoltà comunicative fino al marketing. Ed è considerata una delle nuove frontiere dell’investimento.

Un esempio? ElevenLabs, una startup che sviluppa sistemi basati sull’Intelligenza Artificiale per creare e modificare voci sintetiche, ha annunciato recentemente di aver chiuso un round di 80 milioni di dollari. Parliamo di un’operazione guidata da importanti investitori, tra cui l’azienda statunitense di Venture Capital Andreessen Horowitz, l’ex CEO di GitHub Nat Friedman e l’imprenditore Daniel Gross.

Inoltre, hanno partecipato al round anche altri player come Sequoia Capital, SV Angel e Credo Ventures. Da notare la valutazione di ElevenLabs, che è diventata un unicorno arrivando a oltre 1 miliardo di dollari, contro i circa 100 milioni dello scorso giugno. L’amministratore delegato, Mati Staniszewski (ex stratega della tech Palantir), ha spiegato di aver raccolto nuovi fondi «per consolidare la posizione di ElevenLabs come leader globale» nel suo settore di riferimento. Più nel dettaglio, i nuovi fondi saranno destinati all’ulteriore sviluppo dei prodotti, al potenziamento del team, e al «miglioramento delle misure di sicurezza per garantire uno sviluppo responsabile ed etico della tecnologia IA».

La startup sta vivendo una fase di espansione molto rapida. Basti pensare che l’anno di fondazione risale appena al 2022, grazie all’iniziativa di Piotr Dabkowski, un ex ingegnere tech di Google, e Staniszewski. L’amministratore delegato ha raccontato a TechCrunch che lui e il suo compagno d’impresa sono cresciuti in Polonia, e hanno coltivato l’interesse verso la clonazione vocale per via dei film americani doppiati male. L’Intelligenza Artificiale può fare di meglio, hanno pensato.

Oggi, ElevenLabs è tra le più note applicazioni di generazione vocale, in grado di creare voci realistiche. E consente di regolare diverse opzioni, come l’intonazione, la cadenza e altre caratteristiche vocali. Gratuitamente, gli utenti possono inserire un testo e ottenere una registrazione della sua lettura ad alta voce da una delle voci predefinite. I clienti paganti, invece, possono ad esempio caricare campioni di voce per creare nuovi stili.

ElevenLabs sta investendo sempre di più in versioni della sua tecnologia destinate a molteplici applicazioni, dalla creazione di audiolibri al doppiaggio di film e spettacoli tv, fino alla generazione di voci di personaggi per giochi e per attività di marketing. Inoltre, lo scorso anno l’azienda ha rilasciato uno strumento “speech to speech” che cerca di preservare la voce, la prosodia e l’intonazione di un oratore eliminando automaticamente i rumori di fondo.

Le innovazioni di ElevenLabs hanno conquistato clienti B2B come Paradox Interactive, lo sviluppatore di giochi i cui progetti includono Cities: Skylines 2 e Stellaris. Ma la startup è riuscita anche ad attrarre il The Washington Post. Come evidenziato da TechCrunch, Staniszewski ha poi affermato che «gli utenti di ElevenLab hanno generato l’equivalente di oltre 100 anni di audio e che la piattaforma viene utilizzata dai dipendenti del 41% delle aziende Fortune 500».

Certo, non tutto è sempre rose e fiori. Il giornalista Joseph Cox ha documentato la creazione di un clone di voce abbastanza convincente da ingannare il sistema di autenticazione di una banca. La tecnologia è stata usata anche per diffondere finti messaggi di voci clonate di alcune celebrità. Pertanto, di pari passo con lo sviluppo di queste innovazioni, servono sempre più anche modalità di controllo e prevenzione affinché ne venga fatto un uso lecito.

Un’altra questione aperta riguarda l’impatto occupazionale. Secondo uno studio dell’Organizzazione Internazionale del Lavoro (ILO), l’Intelligenza Artificiale Generativa ha maggiori probabilità di aumentare i posti di lavoro anziché distruggerli, automatizzando alcune mansioni piuttosto che sostituendole completamente. Certo, servirà uno sforzo da parte di governi, imprese e istituzioni al fine di guidare l’ingresso dell’IA in maniera virtuosa nelle economie, nel rispetto della legalità e del bene comune.

ElevenLabs, per esempio, ha garantito il suo impegno nel bloccare gli utenti che violano ripetutamente i suoi termini di servizio e l’utilizzo di uno strumento che, rilevando i discorsi creati sulla sua piattaforma, è utile per fermare gli abusi.