2023/04/21

Podcast RSI - Story: "Drake" e "The Weeknd" banditi da YouTube, Spotify e TikTok: artisti sintetici e intelligenza artificiale nella musica online

logo del Disinformatico

È disponibile subito il podcast di oggi de Il Disinformatico della Radiotelevisione Svizzera, scritto, montato e condotto dal sottoscritto: lo trovate presso www.rsi.ch/ildisinformatico (link diretto) e qui sotto.

Le puntate del Disinformatico sono ascoltabili anche tramite feed RSS, iTunes, Google Podcasts e Spotify (salvo che questa puntata venga bandita perché contiene una canzone controversa).

Buon ascolto, e se vi interessano il testo di accompagnamento e i link alle fonti di questa puntata, sono qui sotto.

---

[CLIP: Heart on My Sleeve - "Drake & The Weeknd" di Ghostwriter]

State ascoltando Heart on My Sleeve, una canzone uscita neanche una settimana fa e subito bandita da YouTube, Tidal e Spotify e in via di sparizione da TikTok dopo circa 15 milioni di visualizzazioni. La rimozione sta avvenendo su richiesta diretta dell’etichetta discografica UMG, Universal Music Group, che considera illegale questo brano perché a suo dire non rispetta i suoi accordi con le piattaforme di streaming e viola il copyright.

Infatti le voci, che avrete probabilmente riconosciuto, non sono in realtà quelle di Drake e The Weeknd. O meglio, in un certo senso sono le loro, ma loro non hanno mai cantato questo brano. Un software di intelligenza artificiale ha “ascoltato” le loro voci, ne ha imparato le caratteristiche peculiari e ha generato voci sintetiche che hanno quelle stesse caratteristiche, usandole per eseguire un brano originale. È giusto farlo? È legale? È la fine della musica come la conosciamo, perché gli artisti verranno soppiantati da loro cloni digitali, pilotati dall’onnipresente intelligenza artificiale?

Questa è la storia di come la tecnologia di registrazione, la digitalizzazione, lo streaming e ora l’evoluzione esplosiva dell’intelligenza artificiale stanno trasformando caoticamente l’industria musicale, creando scenari inattesi che includono le paure di chi si guadagna da vivere con la musica e gli entusiasmi di chi vede queste innovazioni come strumenti di libertà e creatività per tutti.

Benvenuti alla puntata del 21 aprile 2023 del Disinformatico, il podcast della Radiotelevisione Svizzera dedicato alle notizie e alle storie strane dell’informatica. Io sono Paolo Attivissimo.

[SIGLA di apertura]

L’industria musicale è un’anomalia storica

Siamo ormai abituati da tempo ad avere migliaia di brani musicali nelle memorie dei nostri smartphone e milioni di altri a portata di mano grazie ai servizi di streaming audio e video. Poter riascoltare qualunque artista, compresi quelli del passato, ci sembra normalissimo, e ci sembra altrettanto normale che un artista si guadagni da vivere andando in sala di registrazione, incidendo dei brani e vendendo copie di quelle registrazioni, magari senza mai esibirsi in pubblico. Ma in realtà questo modello commerciale è un’anomalia, ed è anche un’anomalia relativamente recente.

Per secoli, l’unico modo in cui un cantante o un suonatore di strumenti musicali poteva campare era cantare o suonare dal vivo. Mecenatismi a parte, se non si esibiva, non veniva pagato. Le registrazioni semplicemente non esistevano. Se la cavavano un po’ meglio i compositori, che potevano scrivere un brano o un’opera su commissione o comporre uno spartito e venderne copie, oppure i fabbricanti di carillon o di pianole.

Ma tutte queste tecnologie di riproduzione musicale sono piuttosto recenti su scala storica: i carillon portatili nacquero negli ultimi anni del Settecento, la pianola fu inventata alla fine dell’Ottocento, e la vendita di massa degli spartiti iniziò nel Novecento. Prima di queste invenzioni, o si cantava e suonava dal vivo, o niente. E la voce dell’artista era legata indissolubilmente alla sua presenza fisica.

Anche quando arrivarono il fonografo di Edison, nel 1877, e il grammofono di Berliner, nel 1894, questi apparecchi meccanici in grado di registrare suoni, strumenti e voci furono visti inizialmente come delle trovate frivole per via del loro suono gracchiante e poco fedele. Ci volle una celebrità assoluta come il tenore italiano Enrico Caruso per dare loro rispettabilità: fu lui il primo cantante a rendersi conto del “potere mediatico”, come si dice oggi, delle tecnologie di registrazione e fu il primo a usarle per guadagnare milioni di dollari* (cifre enormi per l’epoca) vendendo le registrazioni della sua voce fatte fra il 1904 e il 1920.

* Nel 1923 il New York Times scrisse che gli eredi di Caruso avevano ricevuto oltre 585.000 dollari per i diritti dei due anni precedenti, ossia 10,2 milioni di dollari di oggi.

[CLIP: Caruso in “La donna è mobile” (1908), Wikipedia]

Poi vennero tutti gli altri, e il resto è storia: storia dell’industria musicale. Grazie a dischi, nastri e poi supporti digitali e ora lo streaming, la voce di un cantante è diventata un’entità distinta dal cantante stesso, un prodotto commerciale separato che viene protetto da leggi specifiche e gestito da un’industria, ma tutto questo soltanto da poco più di cent’anni. Per tutto il resto della storia della cultura umana non è stato così. Su scala storica, le case discografiche sono un fenomeno passeggero. E con l’arrivo dell’elaborazione digitale e dell’intelligenza artificiale potrebbero essere soppiantate.

Digitalizzazione: la pirateria diventa di massa

Quando una tecnologia crolla di prezzo e diventa facile da usare, succedono sempre cose strane, inaspettate e dirompenti. Per capire cosa sta succedendo adesso è utile riesplorare il passato e far emergere la parola chiave di tutta la vicenda attuale, che è controllo.

La pirateria musicale non è un’invenzione dell’era digitale: già nel 1906 nel Regno Unito furono adottate leggi per proteggere i compositori di musica popolare da coloro che duplicavano abusivamente i loro spartiti e li rivendevano a metà prezzo. La pirateria degli spartiti era un problema talmente serio da giustificare irruzioni di polizia nelle tipografie e nei negozi.

Nei decenni successivi, il fenomeno dei bootleg, ossia delle copie abusive dei dischi, divenne più vasto; ma si trattava comunque di attività che richiedevano macchinari complessi e ingombranti e quindi piuttosto difficili da nascondere a lungo alle autorità. Gli utenti erano tanti, ma i produttori di musica contraffatta erano relativamente pochi e quindi abbastanza facili da tenere sotto controllo. Anche con l’avvento degli impianti stereo personali e dei radioregistratori a doppia piastra che consentivano di duplicare dischi e cassette a livello amatoriale, negli anni Ottanta del secolo scorso, la pirateria rimase un fenomeno tutto sommato modesto per via della scomodità del procedimento, ma questo non impedì all’industria discografica di reagire con celebri campagne terroristiche e slogan come Home taping is killing music (“la registrazione domestica sta uccidendo la musica”). 

Quarant’anni dopo quello slogan, la musica non è ancora morta.

Il vero shock, però, arrivò con la diffusione di massa della musica digitale e poi di Internet. I CD erano in sostanza delle raccolte di file audio, pronte da duplicare ad alta velocità e senza la perdita di qualità tipica delle copie analogiche. E a giugno del 1999 nacque Napster, il primo circuito di scambio musicale peer-to-peer, seguito da Gnutella, Freenet, LimeWire, Kazaa e tanti altri.

Di colpo, con Napster duplicare la musica, legalmente o meno, richiedeva soltanto un computer, un accesso a Internet e del software gratuito. Niente più macchinari ingombranti e costosi; non serviva neanche più il masterizzatore per registrare copie dei CD. Di conseguenza, la pirateria musicale divenne un fenomeno di massa, incontrollabile e su vasta scala. Ciascun utente scaricava centinaia o migliaia di brani e li condivideva con tutti.

Le case discografiche, allarmatissime, agirono prontamente e drasticamente, avviando una causa già a dicembre del 1999, e Napster chiuse a luglio del 2001. Ma altri sistemi peer-to-peer ne presero il posto, e ancora oggi i vari circuiti Torrent fanno circolare musica, video e film tra milioni di persone al di fuori di ogni controllo significativo dei titolari dei diritti.

La legalità di questi circuiti dipende da come funzionano, da cosa viene scambiato e dalle leggi nazionali, ma quello che conta, in questa storia, è che il crollo dei prezzi e della difficoltà d’uso di questa tecnologia ha avuto l’effetto inatteso di far diventare sostanzialmente impossibili il controllo e la repressione* di questi scambi e scaricamenti.

* Le case discografiche ci provarono, introducendo tecnologie per bloccare la duplicazione della musica digitale su CD e nei file scaricabili, come il cosiddetto DRM o Digital Rights Management, ma invano, tanto che alla fine Steve Jobs, nel 2007, pubblicò una storica lettera aperta, Thoughts on Music, nella quale disse chiaramente che i sistemi anticopia erano inutili e controproducenti per l’industria e per gli utenti legittimi (e anche per le vendite degli iPod di Apple) e quindi andavano aboliti. Nel giro di pochi anni la sua proposta fu adottata da tutte le case discografiche, facendo esplodere le vendite legali di musica digitale.

Scaricare e conservare la musica, però, sta passando di moda. Oggi prosperano servizi commerciali e legali di streaming, come TikTok, YouTube e Spotify, che in sostanza mandano al singolo utente in tempo reale il brano desiderato di volta in volta e riportano gli utenti a dipendere da un sistema di distribuzione centralizzato, opposto a quello decentrato dei circuiti peer-to-peer.

Questo stesso modello centralizzato è attualmente usato dai sistemi di intelligenza artificiale più popolari, come Midjourney, DALL-E, Stable Diffusion o ChatGPT: normalmente l’utente li adopera collegandosi ai loro siti, senza dover installare nulla. Questo permette alle aziende e alle autorità di esercitare un controllo centrale sulle attività degli utenti, reprimendo quelle ritenute inaccettabili o illegali, come per esempio la generazione di false immagini pornografiche di persone reali a scopo di molestia e ricatto.

Certo, esistono delle versioni installabili di questi prodotti, ma sono complicate da installare e configurare e richiedono computer potenti e lunghi tempi di addestramento ed elaborazione e quindi sono al di fuori della portata di moltissimi utenti non esperti. Almeno per ora. Ma le cose stanno cambiando in fretta. Molto in fretta.

L’app per diventare Kanye

A fine marzo uno YouTuber, Roberto Nickson, ha trovato su Reddit un modello della voce di Kanye West generato tramite intelligenza artificiale da ignoti. Nel giro di due ore e mezza ha scritto, registrato e diffuso un video nel quale ha prima eseguito con la propria voce uno spezzone di rap inventato da lui [CLIP] e poi ha applicato a quello spezzone il modello vocale trovato su Reddit. Il risultato è quello che sembra un brano originale inedito di Kanye West [CLIP]. Questa breve dimostrazione di Roberto Nickson ha superato i 33 milioni di visualizzazioni solo su Twitter.

Secondo Nickson sono già in lavorazione modelli vocali di altri artisti, come Eminem, Tupac, Michael Jackson e altri ancora, tutti assolutamente non autorizzati e tutti man mano più facili da utilizzare. E la tecnologia galoppa, per cui i modelli diventano anche man mano più fedeli.

Di questo passo, dice Nickson, tra pochi mesi potremo ascoltare brani inediti cantati dalle voci di artisti famosi, senza neppure sapere che sono in realtà generati da software. Frank Sinatra che canta una canzone di Adele? Rihanna che canta in perfetto italiano? Si può fare, fuori da ogni controllo. Basta che ci sia in giro un numero sufficiente di campioni vocali di buona qualità. Enrico Caruso sintetico che canta il repertorio di Lady Gaga forse lo scamperemo, ma per tutto il resto il materiale da campionare non manca.

Per ora le case discografiche hanno reagito con interventi centralizzati: nel caso del finto brano di Drake e The Weeknd, hanno tentato di bloccare la sua circolazione agendo sui gestori dei sistemi di intelligenza artificiale e sui grandi distributori di contenuti, ossia i social network e i servizi di streaming. Ma la canzone sintetica continua a circolare lo stesso attraverso mille altri canali (compreso questo podcast, che spero non venga bloccato da Spotify).

Quando questi software saranno disponibili sotto forma di app da installare sullo smartphone, il controllo e la repressione saranno impraticabili e qualunque intervento legislativo sarà sostanzialmente inapplicabile. E l’incentivo economico non manca: quel finto brano di Drake e The Weeknd, nei pochi giorni in cui è rimasto online, ha fruttato al suo creatore quasi duemila dollari calcolando la tariffa peggiore di Spotify, che è 3 millesimi di dollari per ciascun ascolto, secondo la BBC.

In sintesi: questa tecnologia sta per trasformare completamente l’industria musicale, e sta per farlo a una velocità infinitamente superiore a quella di qualunque provvedimento di legge. Anzi, lo sta già facendo. La rivista specializzata Variety, per esempio, ha notato che su TikTok sono già in crescita le canzoni generate tramite l’intelligenza artificiale dai fan, che prendono brani esistenti e li alterano in modo che sembrino cantati da un altro artista. E i fan di Drake usano regolarmente un generatore basato sull’intelligenza artificiale per creare brani nello stile di questo rapper canadese.

Leggi, case discografiche e Spotify

La legalità del finto brano di Drake e The Weeknd è tutta da chiarire. UMG lo definisce chiaramente illegale e le piattaforme di streaming lo hanno rimosso per scrupolo e per evitare complicazioni, ma le leggi attuali sul copyright riguardano la realizzazione di copie di una registrazione di una specifica interpretazione; secondo alcuni esperti, l’imitazione della pura voce di un artista, fatta da un software che non campiona, non rimonta spezzoni, ma impara uno stile e lo fa per un brano inedito, probabilmente non è soggetta a vincoli di legge. Anzi, la canzone risultante potrebbe anche essere considerata un’opera creativa a sé stante e quindi essere protetta dalla legge, a patto ovviamente di non attribuirla al cantante imitato. UMG, però, ribatte che serve il consenso dei titolari per dare in pasto a un’intelligenza artificiale delle canzoni sotto copyright.

Ma c’è da considerare il fatto che anche alcuni artisti stanno usando questa tecnologia senza cavillare troppo sulle autorizzazioni. Per esempio, di recente David Guetta ha usato il sito Uberduck.ai per imitare la voce di Eminem, senza chiedergli il consenso, aggiungendola a un suo brano, che non può però distribuire commercialmente. Questo:

[CLIP]

E infine va notato che il fronte delle aziende dell’industria musicale non è così compatto come potrebbe sembrare. Gli artisti e le case discografiche mugugnano in coro di fronte al boom della musica generata dall’intelligenza artificiale, ma le piattaforme di streaming hanno un atteggiamento un po’ differente.

Queste piattaforme, infatti, devono ovviamente girare parte dei propri introiti agli artisti di cui diffondono i brani. E altrettanto ovviamente, se questi artisti non esistessero in carne e ossa ma fossero generati dal software, non ci sarebbe bisogno di pagarli. Quindi se la gente pagasse per ascoltare musica sintetica prodotta dall’intelligenza artificiale, magari nello stile di qualche cantante o musicista famoso, i guadagni delle piattaforme di streaming sarebbero massimizzati e quelli delle case discografiche verrebbero azzerati.

Forse è questa la spiegazione di un piccolo mistero scovato su Spotify pochi giorni fa da un utente, Adam Faze: decine di brani musicali strumentali che hanno titoli e autori completamente differenti ma durano tutti esattamente 53 secondi, hanno immagini di copertina assolutamente blande e generiche e soprattutto sono tutti estremamente simili.

[CLIP]

Non è la prima scoperta del suo genere. Già nel 2017 Music Business Worldwide aveva pubblicato un elenco di circa 50 artisti inesistenti che però erano fortemente presenti su Spotify e solo lì: senza nessun’altra presenza online, né su altre piattaforme di streaming né su Instagram, Facebook, SoundCloud o altro. Questi finti artisti erano stati ascoltati ben 520 milioni di volte, per un controvalore di circa 3 milioni di dollari.

Secondo Music Business Worldwide si tratta di persone che accettano compensi microscopici per produrre brani musicali riempitivi molto banali, allo scopo di “ridurre la percentuale della musica delle etichette discografiche legittime nelle playlist… in modo che Spotify possa ridurre i propri costi e l’influenza delle etichette”.

Anche il quotidiano svedese Dagens Nyheter [paywall] ha trovato una vicenda analoga nel 2022: centinaia di falsi nomi di artisti su Spotify, i cui brani sono riconducibili in realtà a una ventina di autori. Uno di questi compositori usava ben 62 pseudonimi e aveva generato da solo quasi 8 milioni di ascolti al mese.

Per le piattaforme di streaming, sostituire questi artisti fittizi con musica generata direttamente dall’intelligenza artificiale sembra essere il passo successivo più logico.

Siamo insomma alla confluenza di vari fenomeni: l’intelligenza artificiale sempre più efficace, i costi di utilizzo sempre più bassi, una zona grigia legale impossibile da colmare in tempo, degli interessi economici in conflitto e degli utenti estremamente motivati che hanno a disposizione strumenti sempre più potenti e sempre meno controllabili centralmente.

In queste condizioni, non ci sarebbe troppo da stupirsi se fra qualche anno diventasse assolutamente normale avere un’app per scegliere liberamente non solo quali canzoni vogliamo ascoltare nella nostra playlist, come facciamo adesso, ma anche chi vogliamo che ce le canti e come le vogliamo arrangiate, con o senza il consenso degli artisti o delle loro case discografiche. Le loro voci non sono più loro, e non c’è nulla che possano fare per riprenderne il controllo.

Ormai indietro non si torna, insomma, e alle etichette musicali resta solo da decidere se vogliono cercare di opporsi invano alle novità tecnologiche o se vogliono stare al passo con i tempi e diventare parte attiva nell’uso di queste novità, per esempio diventando garanti dell’autenticità delle esecuzioni canore o musicali. E potrebbero nascere nuovi mestieri, come il DJ che propone abbinamenti creativi e azzeccati fra voce, strumenti e canzone. Perlomeno finché anche questo compito verrà delegato all’intelligenza artificiale.


Fonti aggiuntive: The Verge, Medium, Britannica, Financial Times (copia su Archive.is), BBC (copia d’archivio), New York Post, BBC.

Nessun commento:

Posta un commento

Se vuoi commentare tramite Disqus (consigliato), vai alla versione per schermi grandi. I commenti immessi qui potrebbero non comparire su Disqus.

Pagine per dispositivi mobili