Questo articolo è disponibile anche in versione podcast audio.
È stato pubblicato pochi giorni fa un nuovo podcast nel quale il popolarissimo podcaster statunitense Joe Rogan intervista un ospite molto speciale: Steve Jobs. I due si parlano e si scambiano opinioni e battute sull’attualità per una ventina di minuti, eppure Jobs, cofondatore di Apple, è morto nel 2011.
Medium e spiritisti non c’entrano: la voce del defunto e quella di Joe Rogan sono state ricreate usando un generatore di voci umane basato sull’intelligenza artificiale, disponibile presso Play.ht, e questo non è realmente il podcast di Joe Rogan: se ci avete fatto caso, infatti, il conduttore si è presentato come Bro Jogan, presumibilmente per evitare complicazioni legali. Si tratta insomma di un podcast sintetico dimostrativo, creato appunto da Play.ht.
Il generatore ha usato registrazioni pubbliche della voce di Jobs e ha “imparato”, per così dire, a parlare come parlava lui. Il risultato è davvero notevole: la voce è quella caratteristica che abbiamo sentito per anni nelle presentazioni dei prodotti Apple.
L’unico indizio di artificialità è il tono, che sembra un po’ troppo da palcoscenico e leggermente fuori luogo per una conversazione personale come è un podcast, ma questo è probabilmente un effetto dei campioni utilizzati, che provengono appunto dalle presentazioni fatte in pubblico. La voce di Joe Rogan, invece, è praticamente perfetta, probabilmente perché il software ha potuto attingere a tutti i suoi podcast, che hanno il tono giusto.
Play.ht propone un servizio nel quale i clienti usano voci sintetiche generiche oppure personalizzate. In sostanza, è possibile mandare all’azienda dei campioni di una voce che si desidera usare e poi farle dire qualunque cosa. Le demo sono davvero notevoli, con esempi delle voci sintetiche di Elon Musk, Tom Hanks e persino del presidente statunitense John Kennedy, assassinato nel 1963.
Per ora questa tecnologia viene usata presso Podcast.ai dichiarando esplicitamente che si tratta di voci sintetiche create per intrattenimento e offrendo agli ascoltatori la possibilità di scegliere gli ospiti virtuali; inoltre i tempi di generazione sono relativamente lenti, per cui non è possibile usare software di questo tipo per imitare qualcuno in diretta al telefono, per esempio. Ma è il caso di cominciare a non fidarsi delle registrazioni audio di persone famose o dei nostri amici e conoscenti, specialmente se dicono cose che non direbbero mai.
Fonte aggiuntiva: Gizmodo.
Nessun commento:
Posta un commento
Se vuoi commentare tramite Disqus (consigliato), vai alla versione per schermi grandi. I commenti immessi qui potrebbero non comparire su Disqus.