Cerca nel blog

2010/04/01

Rastrellati i dati di 210 milioni di utenti, Facebook interviene

Quanto è facile censire gli utenti di Facebook? Tanto da scatenare gli avvocati


Pete Warden, un esperto in ricerche online, è riuscito da solo a raccogliere e analizzare i dati pubblici di 210 milioni di utenti di Facebook, correlandoli per far emergere relazioni statistiche nascoste fra utenti: nomi, indirizzi, amicizie e interessi, tutti pubblicati dagli utenti del social network, hanno permesso di ricavare una mappa delle relazioni interpersonali online degli Stati Uniti molto illuminante dal punto di vista demografico e sociale, scoprendo per esempio città lontane iperconnesse fra loro e altre località vicine che invece non si parlano affatto e rivelando una ripartizione del paese in grandi aree dai comportamenti sociali fortemente differenti.

Warden aveva intenzione di pubblicare il proprio archivio, dopo averlo debitamente anonimizzato, perché sarebbe stato uno strumento prezioso per molti ricercatori interessati a studiare le interazioni sociali moderne, ma gli avvocati di Facebook gli hanno intimato di non pubblicarlo e gli hanno anzi chiesto di distruggerlo. Cosa che Warden, non avendo soldi per sostenere una lite legale, ha fatto.

Secondo l'ufficio legale di Facebook, la raccolta di dati violava le condizioni di servizio del social network ("Non raccogliere contenuti o informazioni degli utenti, né accedere in altro modo a Facebook, usando strumenti automatizzati (come bot di raccolta, robot, spider o scraper) senza la nostra autorizzazione"). Warden, però, si difende dicendo che non ha mai sottoscritto quelle condizioni, perché ha raccolto soltanto dati che erano accessibili senza fare login a Facebook e che sono tuttora accessibili anche tramite la cache di Google.

L'attività di Pete Warden non è un caso isolato: altri ricercatori, nota New Scientist, hanno già utilizzato tecniche analoghe per analizzare i dati pubblici di Facebook e altri social network per estrarre correlazioni poco evidenti a prima vista ma molto interessanti da studiare. E da sfruttare commercialmente: il fatto che un singolo ricercatore, con le proprie risorse private, sia riuscito ad acquisire quest'enorme numero di dati personali dimostra quanto sia facile questo censimento di massa, che permette per esempio a un'azienda di acquisire informazioni dettagliate sui propri clienti tramite correlazioni con altri database pubblici (quelli dei censimenti governativi, per esempio) e magari rivendere queste informazioni senza avere la correttezza di anonimizzarle.

Le tecniche descritte da Warden e dai suoi colleghi permettono anche a uno spammer senza scrupoli di usare le informazioni raccolte per bombardare gli utenti con campagne pubblicitarie mirate. La norma sociale in fatto di privacy sarà anche cambiata, secondo Mark Zuckerberg, fondatore di Facebook, ma l'irritazione prodotta dallo spam no.

Soprattutto, casi come questo dimostrano che anche nei social network il tutto è più della somma delle sue parti, per dirla con Aristotele: il singolo dato pubblicato può sembrare innocuo e anonimo, ma la massa dei dati può essere analizzata e incrociata con altre fonti per estrarne profili personali tutt'altro che anonimi, come si è visto di recente in un paio di casi emblematici.

Prudenza, dunque, anche perché ogni tanto Facebook inciampa e alle falle strutturali aggiunge quelle momentanee. Per esempio, il 30 marzo scorso gli indirizzi di e-mail degli utenti Facebook che erano stati impostati come privati sono diventati tutti pubblici per circa mezz'ora; poi sono ridiventati privati. Gli spammer ringraziano.

Nessun commento: