Cerca nel blog

2018/05/11

Ingannare Siri, Alexa, Google Assistant con comandi vocali nascosti

I dispositivi digitali dotati di riconoscimento vocale hanno una caratteristica che per molti utenti è inaspettata: “sentono” e “capiscono” in maniera molto differente da come lo facciamo noi. Di conseguenza, suoni che per noi non hanno senso, o non sono neanche udibili, possono essere usati per mandare a questi dispositivi dei comandi nascosti.

Un gruppo di studenti universitari statunitensi ha ampliato le ricerche iniziate nel 2016 e ora ha dimostrato di essere in grado di nascondere comandi vocali all’interno del rumore bianco, un particolare tipo di fruscio, simile a quello che si capta sintonizzando una radio su una frequenza dove non c’è una stazione che trasmette. L’orecchio umano sente solo fruscio, appunto, ma i sistemi di riconoscimento vocale captano i comandi e li eseguono. Nel video, un iPhone bloccato viene indotto a comporre un numero telefonico usando questa tecnica.


I ricercatori dicono di essere stati in grado di attivare Google Now per mettere il telefono in modalità aereo e di manipolare il sistema di navigazione di un’auto della Audi, di indurre uno smartphone a visitare un sito pericoloso, a fare una foto o inviare un messaggio.

Altri studiosi hanno dimostrato di poter creare frasi che al nostro orecchio sembrano dire una cosa ma che vengono interpretate in tutt’altro modo da questi dispositivi (un esempio semplice: cocaine noodles viene interpretato come OK Google), oppure canzoni che contengono messaggi “subliminali” (stavolta sul serio, non come nella leggenda metropolitana).

Questo genere di attacco è prevenibile evitando di tenere costantemente aperto il microfono dei dispositivi, cosa peraltro consigliabile anche per altre ragioni.

5 commenti:

Tony ha detto...

Io ricordavo gli spaghetti di soia ma è da tempo che non frequento ristoranti asiatici.
Devo tornarci al più presto ;)

roberto mangherini ha detto...

dopo 2 o tre volte che mi si è attivato da solo in camere silenziose ho spento al funzione da oramai un anno.

Beppe ha detto...

in realtà il rumore bianco, per definizione, non può avere nessun contenuto informativo, per cui non può contenere nessun comando

Unknown ha detto...

Mi sembra sia una grossa falla. Non vedo l'utilità di un DSP che elabori al di fuori del range di frequenze del parlato.

pgc ha detto...

Beppe: "in realtà il rumore bianco, per definizione, non può avere nessun contenuto informativo, per cui non può contenere nessun comando"

Al contrario: ammettendo per un attimo che questo possa esistere (cosa impossibile perché il rumore bianco ha per definizione una larghezza di banda illimitata) il rumore bianco può contenere il massimo di informazione possibile in una qualsiasi comunicazione. In altre parole una comunicazione ottimale in termini di contenuto di informazione trasferito "apparirebbe" come rumore bianco.