Cerca nel blog

2022/02/17

Le voci deepfake in Star Wars: The Book of Boba Fett

Questo articolo è disponibile anche in versione podcast.

Allerta spoiler: questo articolo rivela alcuni avvenimenti importanti delle serie TV The Mandalorian e di The Book of Boba Fett. 

Se state seguendo le serie TV The Mandalorian e The Book of Boba Fett, conoscerete già una delle loro sorprese più emozionanti: torna un personaggio amatissimo da tutti i fan di Star Wars, e torna ringiovanito, grazie alla tecnologia digitale, con risultati incredibilmente realistici. Non vi preoccupate: non dirò di chi si tratta. Non subito, perlomeno [non è Yoda come l’immagine qui accanto potrebbe far pensare].

Ma a differenza di altri attori e attrici del passato, che sono stati ricreati o ringiovaniti creando un modello digitale tridimensionale dei loro volti e poi allineando faticosamente questo modello alle fattezze attuali dell’attore o di una sua controfigura, con risultati spesso discutibili e innaturali, sembra (ma non è ancora confermato ufficialmente) che in questo caso sia stata usata la tecnica del deepfake.

In pratica, nei deepfake si attinge alle foto e alle riprese video e cinematografiche che mostrano quella persona quando era giovane, si estraggono le singole immagini del suo volto da tutto questo materiale e poi si dà questo repertorio di immagini in pasto a un software di intelligenza artificiale, che le mette a confronto con le riprese nuove dell’attore o della controfigura e sovrappone al volto attuale l’immagine di repertorio, correggendo ombre e illuminazione secondo necessità. Sto semplificando, perché il procedimento in realtà è molto complesso e sofisticato, e servono tecnici esperti per applicarlo bene, ma il principio di fondo è questo.

Sia come sia, il risultato in The Book of Boba Fett, in una puntata uscita pochi giorni fa, lascia a bocca aperta: le fattezze del volto ricreato sono perfette, le espressioni pure, e il personaggio rimane sullo schermo per molto tempo, in piena luce, interagendo in maniera naturale con gli altri attori, mentre in passato era apparso in versione ringiovanita solo per pochi secondi e in penombra, in disparte. 

Mentre la prima apparizione di questo personaggio digitale in The Mandalorian nel 2021 aveva suscitato parecchie critiche per la sua qualità mediocre, nella puntata di Boba Fett uscita di recente l’illusione è talmente credibile che fa passare in secondo piano un dettaglio importante: anche la voce del personaggio è sintetica.

Può sembrare strano, visto che la persona che lo interpreta è ancora in vita e recita tuttora (non vi dico chi è, ma l’avete probabilmente già indovinato). Invece di chiamarla a dire le battute e poi elaborare digitalmente la sua voce per darle caratteristiche giovanili, i tecnici degli effetti speciali hanno preferito creare un deepfake sonoro.

Lo ammette candidamente Matthew Wood, responsabile del montaggio audio di The Mandalorian, in una puntata di Disney Gallery dedicata al dietro le quinte di questa serie: delle registrazioni giovanili dell’attore sono state date in pasto a una rete neurale, che le ha scomposte e ha “imparato” a recitare con la voce che aveva l’attore quando era giovane. 

La rete neurale in questione è offerta dall’azienda Respeecher, che offre servizi di ringiovanimento digitale per il mondo del cinema, permettendo per esempio a un attore adulto di dare la propria voce a un bambino oppure di ricreare la voce di un attore scomparso o non disponibile.

La demo di Respeecher in cui la voce di una persona normale viene convertita in tempo reale in quella molto caratteristica di Barack Obama è impressionante:

In The Book of Boba Fett, il tono è corretto, le inflessioni della voce sintetica sono azzeccate, ma la cadenza è ancora leggermente piatta e innaturale.

Ci vuole ancora un po’ di lavoro per perfezionare questa tecnologia, ma già ora il risultato della voce sintetica è sufficiente a ingannare molti spettatori e a impensierire molti attori in carne e ossa, che guadagnano dando la propria voce a personaggi di cartoni animati o recitando audiolibri.

Ovviamente per chi ha seguito la versione doppiata della serie tutto questo lavoro di deepfake acustico è stato rimpiazzato dalla voce assolutamente reale del doppiatore italiano (Dimitri Winter), ma a questo punto si profila all’orizzonte la possibilità che il deepfake della voce possa consentire a un attore di “parlare” anche lingue straniere e quindi permetta di fare a meno del doppiaggio. Con il vantaggio, oltretutto, che siccome il volto dell’attore è generato digitalmente, il labiale potrebbe sincronizzarsi perfettamente con le battute in italiano, per esempio.

C’è il rischio che queste voci manipolabili a piacimento consentano di creare video falsi di politici o governanti che sembrano dire frasi che in realtà non hanno detto, come ha fatto proprio Respeecher nel 2019 in un caso molto particolare: ha creato un video, ambientato nel 1969, in cui l’allora presidente degli Stati Uniti Richard Nixon annuncia in televisione la tragica morte sulla Luna degli astronauti Neil Armstrong e Buzz Aldrin (mai avvenuta), mettendo in bocca al presidente parole ispirate al discorso che era stato scritto nell’eventualità che la loro missione Apollo 11 fallisse.

Respeecher non è l’unica azienda del settore. Google, per esempio, offre il servizio Custom Voice, che permette di replicare la voce di una persona qualsiasi mandandole un buon numero di campioni audio di alta qualità. Funziona molto bene: infatti non vi siete accorti che da qualche tempo a questa parte i miei podcast sono realizzati usando la mia voce sintetica, data in pasto a un file di testo apposito.

Tranquilli: sto scherzando. Per ora.

Nessun commento: