Cerca nel blog

2018/04/19

Intelligenze artificiali per creare cartoni animati o isolare voci

Ultimamente si fa un gran parlare di intelligenza artificiale: sembra quasi che qualunque progetto informatico o tecnologico che non includa queste parole magiche sia da cavernicoli, e molti fra i non addetti ai lavori immaginano chissà quali computer superintelligenti o robot assassini pronti a dominare il mondo e renderci schiavi.

La realtà, per fortuna, è molto diversa: quella che oggi viene chiamata “intelligenza artificiale” non è un’intelligenza generalista ma è una tecnologia che risolve un singolo problema ben specifico ma non è capace di fare altro. Però quello che fa, lo fa con una capacità sorprendente.

Prendete per esempio il progetto presentato di recente dall’Allen Institute for Artificial Intelligence di Seattle, negli Stati Uniti: è un software superspecializzato, chiamato Craft, che è capace di creare un cartone animato dei Flintstones tutto da solo, partendo soltanto da una descrizione scritta delle situazioni da animare. Craft è stato addestrato dandogli in pasto circa 25.000 spezzoni di questi popolarissimi cartoni classici, ciascuno dotato di una descrizione testuale, ed è capace di decodificare queste istruzioni e cucire insieme gli elementi contenuti negli spezzoni per creare un cartone nuovo.


I risultati non sono da premio Oscar, ma sono un’anteprima dimostrativa di quello che potrebbe accadere fra qualche anno: invece di spendere mesi e milioni per creare un cartone animato, gran parte del lavoro ripetitivo, tipico di questa forma d’arte, che richiede dieci o più disegni per ogni secondo di durata, potrebbe essere delegato a un’intelligenza artificiale specializzata, lasciando agli artisti gli aspetti creativi e permettendo quindi a chiunque di portare sullo schermo storie che prima sarebbero state impossibilmente costose e laboriose da animare.

Un altro esempio di queste intelligenze artificiali dedicate a un singolo compito arriva da Google, che ha presentato una dimostrazione di un sistema che riesce a isolare una singola voce da un gruppo di persone che parlano contemporaneamente: una cosa che noi umani sappiamo fare molto bene ma che i computer normalmente fanno malissimo. La tecnica usata da questo sistema è molto umana: l’intelligenza artificiale si addestra guardando i volti delle persone mentre parlano singolarmente e impara a riconoscere i suoni corrispondenti alla forma della loro bocca. A quel punto è capace di scartare tutti i suoni estranei.



I risultati sono impressionanti e le applicazioni sono molto promettenti: questo sistema di Google sarebbe utilizzabile per esempio per rendere più comprensibile la voce di una persona che fa una videochiamata in una stanza affollata e rumorosa oppure per creare apparecchi acustici che fanno sentire bene solo la voce della persona che ci sta davanti e smorzano tutte le altre, per esempio in un locale pieno di persone che chiacchierano.



Naturalmente questo tipo di ascolto selettivo, che Google sta già valutando di includere in alcuni dei propri prodotti, sarebbe utilizzabile anche in modi più controversi. Per esempio, sarebbe perfetto per le intercettazioni o per spiare una conversazione in un ambiente rumoroso. Ma di certo il settore dell’intelligenza artificiale, che sta compiendo progressi rapidissimi, non è pronto per dominarci tutti, ma è solo un utile servo. Almeno per ora.


Questo articolo è basato sul testo preparato per il mio servizio La Rete in 3 minuti per Radio Inblu del 16 aprile 2018. Fonte aggiuntiva: Engadget,

8 commenti:

Stefano ha detto...

E' altamente plausibile che nell'ambito delle intercettazioni di sicurezza nazionale questa tecnologia sia gia' stata sviluppata e a livelli di efficienza, naturalmente, classificati.

Gianmaria ha detto...

Articolo molto interessante.

Un altra applicazione veramente interesssante per i film e il "face swapping"

https://www.youtube.com/watch?v=614we6ZaQ04

la differenza tra un software amatoriale e i mezzi delle major cinematografiche è veramente ridotta rispetto ai relativi costi.

Poi come dice la regola 34 di internet, se qualcosa esiste, c'è anche la sua versione porno, senza eccezioni.

https://www.theverge.com/2018/1/24/16929148/fake-celebrity-porn-ai-deepfake-face-swapping-artificial-intelligence-reddit

Psk ha detto...

Come si dice?
Da grandi poteri ... derivano grandi calamità

o, più seriamente, non esistono scienza e tecnologie malvage, ma solo un uso sbagliato di esse (per un'opportuna definizione di "giusto" e "sbagliato")

Diego Laurenti ha detto...

"La realtà, per fortuna, è molto diversa: quella che oggi viene chiamata “intelligenza artificiale” non è un’intelligenza generalista ma è una tecnologia che risolve un singolo problema ben specifico ma non è capace di fare altro. Però quello che fa, lo fa con una capacità sorprendente."

Questo mi fa pensare prepotentemente ad AlphaGo di DeepMind e di tutta la sua epopea!

Davide Bellone ha detto...

Questo vuol dire che, a tutti gli effetti, può anche escludere da una registrazione una specifica voce, no?

Marco ha detto...

Veramente è dal 2001 che esistono AI che sono in grado persino di leggere i labiali... ;-)))))
https://www.youtube.com/watch?v=mvLgvychb18

Dottor Andrea Verdi ha detto...

Le intelligenze artificiali non saranno in grado di dominarci ma, nel dubbio, approfitto di questo post per dire "lode e gloria ai nostri nuovi Signori Robot". Aggiungo anche che un cerusico appassionato di informatica come il sottoscritto potrebbe sempre essere utile nel loro progetto di conquista dell'Umanità.

https://youtu.be/8lcUHQYhPTE

Scatola Grande ha detto...

Sull'intelligenza generalista ci sarebbe da ridire, molte di queste AI sono basate su reti neurali artificiali che, opportunamente addestrate, sono in grado di risolvere un ampia varietà di problemi. Per cui se ci si riferisce alle reti neurali in generale non è vero che non sono generaliste.
Se ci si riferisce invece alla rete addestrata allora si, sono in grado di risolvere solo i problemi per cui sono state addestrate.