Cerca nel blog

Motori di ricerca: uso avanzato per giornalisti, debunker e investigatori

di Paolo Attivissimo. Ultimo aggiornamento: 2018/07/06 23:40. Distribuzione libera sotto licenza Creative Commons Attribuzione - Non commerciale - Non opere derivate 2.5 Italia. I dettagli legali di questa licenza di distribuzione sono disponibili in italiano qui. Segnalate eventuali errori, link obsoleti, aggiunte o aggiornamenti scrivendo a paolo.attivissimo@gmail.com.

Link breve: tinyurl.com/guida-motori-ricerca.


Indice


1. Come funziona un motore di ricerca: le cose da sapere
2. Quello che un motore di ricerca non mostra
3. Google: ricerca avanzata
4. Ricerca e recupero di documenti rimossi, modificati o nascosti; ricerca storica
5. Google: ricerca selettiva per tipo di pubblicazione
6. Google: ricerca meno personalizzata
7. Ricerche private nel Web e nel dark Web: Tor
8. Simulazione di altri dispositivi
9. Monitoraggio automatico con Google Alerts
10. Motore di ricerca personalizzato con Google Custom Search Engine
11. Ricerche nei social network
12. Ricerche di e per immagini e video
13. Analisi forense di immagini
14. Motore di ricerca matematico: Wolfram Alpha
15. Ricerca e identificazione di brani musicali
16. Altri archivi e motori di ricerca specialistici
17. Ricerche negli account Google




1. Come funziona un motore di ricerca: le cose da sapere


Un motore di ricerca, come Google o Bing, è un grande sistema informatico che esplora metodicamente e automaticamente tutte le parti accessibili di Internet e ne cataloga e archivia il contenuto. Questo catalogo e questo archivio vengono aggiornati costantemente e sono consultabili dagli utenti comuni visitando il sito del motore di ricerca (per esempio Google.com).

Ogni motore di ricerca è composto da due elementi fondamentali: il software “esploratore”, denominato spider (“ragno”, dato che esplora il Web, che in inglese significa “ragnatela”), e l’algoritmo, che decide i criteri d’importanza con i quali vengono presentati agli utenti i risultati dell’esplorazione.

L’“esploratore” ha vari nomi: per esempio, Googlebot per Google, Bingbot per Bing e Yahoo, BaiduSpider per Baidu o YandexBot per Yandex. Una classifica degli spider più importanti di Internet e della portata della loro capacità esplorativa è disponibile presso Incapsula.com.

L’algoritmo, invece, di solito non ha un nome, tranne nel caso di Google, che lo chiama PageRank perché determina il rango (rank in inglese) delle pagine del Web.

Il funzionamento esatto di questi componenti è un segreto commerciale, ma i documenti brevettuali pubblicati da Google, per esempio, gettano un po’ di luce sull’argomento: i link presenti nelle pagine esplorate da Googlebot contribuiscono fortemente a determinare l’importanza di una pagina nei risultati del motore di ricerca.

Il concetto di fondo è che se una pagina Web viene linkata da un’altra, vuol dire che la pagina linkata è considerata importante: è una sorta di voto di approvazione (o, per analogia con Facebook, è una sorta di “Mi piace”). Più “voti” ha un link, più è probabile che sarà in cima alla classifica dei risultati del motore di ricerca.

Ma anche l’importanza della pagina che ospita il link è determinante. Per esempio, se il sito di una testata giornalistica autorevole linka una data pagina Web, quella pagina Web sale di rango nella classifica dei risultati del motore di ricerca. Se un blog di un utente qualsiasi linka quella stessa pagina, l’effetto promozionale è molto più debole.

In parole povere: più una pagina è linkata da altre pagine importanti e autorevoli del Web, più quella pagina diventa a sua volta importante ed emerge in cima ai risultati presentati dal motore di ricerca.

Il meccanismo è simile a quello usato dalle riviste scientifiche: più un articolo viene citato da riviste autorevoli, più viene considerato meritevole.

Per saperne di più:
Accanto a questo criterio fondamentale, tuttavia, quasi tutti i motori di ricerca ne usano anche altri, che personalizzano i risultati in base a chi li richiede o al luogo nel quale vengono richiesti. Uno degli scopi di questa guida è evitare questa personalizzazione, che può rendere irreperibili o nascondere i risultati che in realtà interessano maggiormente a un utente.



1.1. Google, gigante incontrastato ma generalista


In termini di quota di mercato, Google sovrasta di gran lunga tutti gli altri motori di ricerca (figura qui sotto) e offre un maggior numero di opzioni di ricerca selettiva. Per questo motivo è opportuno dedicare a questo colosso buona parte della presente discussione dei motori di ricerca, perché in pratica l’universo dei motori di ricerca è costituito da Google più le briciole. Queste sono le quote di mercato dei principali motori di ricerca, gennaio 2010-aprile 2018 (fonte: Statista.com, con grafico):

Google: 86.28%
Bing: 5.82%
Yahoo!: 2.98%
Baidu: 0.86%


Tuttavia gli altri motori possono, a volte, essere più efficienti su temi specifici, per cui non vanno trascurati completamente.

Per esempio:
  • Google (Google.com) eccelle nel fornire i cosiddetti “dieci link blu”, ossia una pagina scarna nella quale sono elencati i dieci risultati che con maggiore probabilità soddisfano la richiesta dell’utente, e offre la possibilità di effettuare ricerche estremamente complesse.
  • Bing (Bing.com) è maggiormente specializzato di Google nella copertura degli argomenti più popolari e offre più grafica e informazioni direttamente sulla pagina iniziale; offre inoltre risposte a formule matematiche complesse tramite Wolfram Alpha (sito specializzato nella risoluzione di quesiti di statistica e matematica).
  • Yahoo! Search (search.yahoo.com) usa Bing e Google, ma ne modula diversamente i risultati.
  • Baidu (baidu.com) è specializzato nelle ricerche in cinese.
  • Yandex (yandex.ru) copre le ricerche in russo; esiste anche in versione ucraina (yandex.ua), inglese (yandex.com), turca (yandex.com.tr), kazaka (yandex.kz) e bielorussa (yandex.by).
  • DuckDuckGo (Duckduckgo.com) si distingue perché, a differenza di Google e degli altri motori di ricerca, non personalizza i risultati in base all’utente ed è molto più rispettoso della privacy (alcune forti motivazioni per preoccuparsi della schedatura sistematica delle ricerche effettuate dagli utenti ad opera di Google e altri motori di ricerca, con implicazioni a lungo termine sia personali sia politiche, sono descritte in questo articolo del 2011); inoltre fornisce risultati che sono un ibrido di quelli forniti da Yandex, Yahoo, Bing, Wolfram Alpha e Yummly (motore specializzato in alimentazione, cucina e ricette, che consente ricerche in base a ingredienti, diete, allergie, prezzo, sapori e “impara” i gusti dell’utente). Inoltre è disponibile sul dark web tramite Tor.
  • Startpage (Startpage.com), come DuckDuckGo, è un motore di ricerca che non raccoglie dati personali; diversamente da DuckDuckGo, è basato soltanto su Google.




2. Quello che un motore di ricerca non mostra


È importante tenere presente che Google non è Internet, anche se è vero che per la maggior parte degli utenti quello che Google non vede (o non mostra) in pratica non esiste. C’è un’enorme parte di Internet che sfugge completamente a una ricerca tramite Google o quasi tutti altri i motori di ricerca.

Infatti Google vede e indicizza (ossia cataloga) fondamentalmente tutte le pagine del Web e tutti i documenti che sarebbero accessibili a un normale utente dotato di browser (Internet Explorer, Firefox, Chrome, Safari). La parte di Internet che è accessibile a un comune motore di ricerca come Google è denominata Web di superficie (surface Web) e corrisponde grosso modo a tutte le pagine Web che sarebbero visibili a un utente che passasse la vita a cliccare su ogni link in ogni pagina.

Google non può vedere/indicizzare:
  • il contenuto non pubblico dei principali social network (Facebook, Twitter, Ask.fm, Instagram.com, LinkedIn, Pinterest);
  • il contenuto delle pagine in formato Flash o Silverlight, nelle quali il testo è reso graficamente invece di usare caratteri;
  • le pagine Web che includono uno speciale codice di divieto contenuto in un file di nome robots.txt che viene pubblicato da ciascun sito;
  • le pagine oscurate dal “diritto all’oblio” secondo le disposizioni dell’Unione Europea;
  • il deep web;
  • il dark web.



2.1. Diritto all’oblio


A maggio 2014 l’Unione Europea ha imposto a Google di rimuovere dai propri risultati i link che ledono il cosiddetto “diritto all’oblio” se ne riceve richiesta dalla parte lesa, come spiegato in questa pagina di Google. La rimozione avviene se i diritti di privacy del richiedente superano le esigenze dell’interesse pubblico ad accedere alle informazioni in questione. Di conseguenza, chi consulta Google dall’Europa (Svizzera compresa) ottiene talvolta risultati incompleti o parzialmente oscurati in base a questa norma.



2.2. Deep Web e Dark Web


Qualunque contenuto che sfugga all’esplorazione compiuta da un motore di ricerca è definito Web sommerso (deep Web). Se un contenuto è accessibile soltanto dopo aver digitato qualcosa in una casella di ricerca di un sito (come nel caso di un dizionario online, le cui definizioni sono accessibili solo se si immette il lemma cercato), è deep Web.

È deep Web qualunque contenuto di un sito della pubblica amministrazione accessibile solo dopo aver immesso un riferimento in una casella (per esempio il nome dell’azienda nei registri del commercio, il numero di brevetto o il nome dell’inventore nell’archivio dell’Ufficio Brevetti Europeo). Anche il catalogo di una biblioteca è deep Web.

Questi contenuti non sono stati nascosti volutamente all’occhio dei motori di ricerca: semplicemente sono inaccessibili a causa di limitazioni tecniche. Quello che è importante sottolineare è che il contenuto del deep Web non è necessariamente illecito e pericoloso come viene spesso asserito dai media.

All’interno di questo deep Web c’è una parte, relativamente piccola, che invece è stata nascosta intenzionalmente ai motori di ricerca e non è accessibile tramite i normali browser: questa parte è denominata Web oscuro (dark Web).

Un esempio piuttosto noto di questo dark Web è la rete Tor, che è una rete anonimizzata alla quale si accede soltanto usando un particolare browser, denominato Tor e scaricabile presso Torproject.org. Questa è la parte di Internet spesso associata ad attività illecite per via dell’anonimato quasi totale che consente.



2.3. La bolla di filtraggio (filter bubble)


Nel tentativo di offrire ai propri utenti un servizio sempre più efficiente, i motori di ricerca ricorrono a una sofisticata personalizzazione dei risultati offerti. Questo vuol dire che un utente può ottenere risultati differenti da un altro.

Questa personalizzazione attinge per esempio alle informazioni accumulate sull’utente dal motore: la sua ubicazione, la cronologia delle sue ricerche, i suoi clic passati, i suoi interessi dedotti dalle ricerche precedenti, il tipo di dispositivo e di browser utilizzato, la lingua usata e molto altro ancora.

Dato che questo approccio privilegia i risultati che si conformano ai bisogni e ai punti di vista correnti dell’utente, si forma quindi intorno a ciascun utente una “bolla di filtraggio” (filter bubble) che lo separa dalle informazioni che non concordano con il suo punto di vista o sono al di fuori dei suoi interessi (per come li ha dedotti Google). È una sorta di ghetto culturale e ideologico autorinforzante, che impedisce una visione obiettiva e pertanto va contrastato se si desiderano risultati di ricerca non falsati.




3. Google: ricerca avanzata


Prima di addentrarci nelle tecniche per eludere questa “bolla di filtraggio” è opportuno riepilogare brevemente le principali opzioni utili per affinare i risultati offerti da Google. Queste opzioni, sommate con le tecniche citate, permetteranno di indurre Google a mostrarci quello che cerchiamo invece di quello che Google cerca di farci trovare.

Le opzioni di ricerca avanzata di Google sono consultabili in due modi fondamentali:
  • accedendo alla pagina apposita (www.google.com/advanced_search) e compilandone i campi in base alle specifiche esigenze (con criteri che includono per esempio lingua, area geografica, sito o dominio, tipo di file);
  • immettendo nella casella di ricerca della pagina standard di Google alcuni operatori, che possono anche essere combinati fra loro per ottenere ricerche ancora più selettive.

Va ricordato che Google non fa distinzione fra maiuscole e minuscole, con l’unica eccezione dell’operatore OR, che deve essere scritto in maiuscolo. A parte questo, digitare mario bernasconi, Mario Bernasconi o MARIO bernasconi non fa alcuna differenza.

Qui di seguito vengono presentati gli operatori più comuni: ve ne sono però molti altri, elencati presso Google, GoogleGuide.com e Moz.com.



3.1. Virgolette (esatta sequenza)


Se si immette in Google una serie di parole, Google restituirà le pagine più significative che contengono quelle parole in qualunque ordine e anche in punti separati della pagina. Se invece si desidera ottenere un elenco delle pagine che contengono l’esatta sequenza di parole, occorre:
  • racchiuderle tra virgolette nella normale casella di ricerca di Google; oppure
  • immetterle nella casella “questa esatta parola o frase” della pagina di ricerca avanzata.

Per esempio, per cercare le pagine che citano una persona è più efficace digitare il suo nome e cognome fra virgolette:

“Giovanni Nembrini”

oppure digitarlo nella casella “questa esatta parola o frase”, altrimenti Google troverà anche le pagine che parlano di altre persone che hanno lo stesso cognome ma un nome differente.

Google è comunque abbastanza sofisticato da riconoscere spesso i nomi e cognomi delle persone celebri e i titoli di film, libri e canzoni anche senza questa opzione, che è invece particolarmente utile quando si cerca una persona poco nota oppure una citazione esatta di una frase.



3.2. Asterisco


Se si vuole cercare una frase e le sue varianti si può usare l’asterisco come carattere jolly. Per esempio,

"non * di lor ma guarda e passa"

chiede a Google di elencare i siti che contengono la citazione dantesca sia nella sua versione corretta (con ragioniam al posto dell’asterisco), sia in quella popolare (con ti curar al posto dell’asterisco).

Questa opzione di ricerca non ha una casella apposita nella pagina di ricerca avanzata, ma può essere usata per esempio nella casella “questa esatta parola o frase”.



3.3. Alternative (OR oppure |)


In una ricerca di testo si può specificare un’alternativa usando OR (scritto in maiuscolo) oppure il carattere “barra verticale” (ossia “|”): per esempio, scrivere

divorzio “Brad Pitt” OR “Angelina Jolie”

farà emergere nei risultati le pagine che contengono la parola divorzio e il nome esatto Brad Pitt e anche le pagine che contengono la parola divorzio e il nome esatto Angelina Jolie.

dentifricio | pangolino

restituirà qualunque pagina che contenga la parola dentifricio oppure la parola pangolino.

Nella pagina di ricerca avanzata si immettono le alternative nella casella “una qualunque di queste parole”.



3.4. Esclusione (-)


Si può chiedere a Google di non includere nei risultati una parola specifica o una sequenza specifica di parole: basta precederla con un segno “-” (senza spazio dopo il segno). Per esempio,

calcio -campionato

escluderà dalla ricerca i siti che parlano del campionato di calcio e privilegerà quelli che parlano dell’elemento chimico; oppure

salsa -danza

escluderà buona parte dei siti dedicati al ballo e farà emergere quelli di cucina.

Viceversa,

salsa -cucina

darà come risultato principalmente siti dedicati al ballo e non elencherà quelli dedicati alla salsa come prodotto culinario.

Si può escludere una sequenza precisa di parole mettendole tra virgolette:

salsa -"ricetta di cucina"


Nella pagina di ricerca avanzata si immettono le parole da escludere nella casella “nessuna di queste parole”.



3.5. Ricerca limitata a un sito o a un dominio


È possibile ordinare a Google di limitare la propria ricerca a un sito specifico immettendo il nome del sito nella casella “sito o dominio” della pagina di ricerca avanzata oppure usando l’operatore site seguito dal due punti e dal nome del sito, senza spazi dopo il due punti, nella casella di ricerca normale. Per esempio,

“Giovanni Nembrini” site:rsi.ch

limiterà l’ambito della ricerca alle pagine Web accessibili del sito della Radiotelevisione Svizzera di lingua italiana che contengono quel nome abbinato a quel cognome, oppure

“coniglio d’amministrazione” site:facebook.com

cercherà esclusivamente in Facebook questo frequente errore di battitura.

Si può anche restringere ulteriormente la portata della ricerca, limitandola a una sottosezione di un singolo sito, se si specifica il suo path, come per esempio in

“coniglio d’amministrazione” site:aziendaesempio.com/it/organigramma/

È inoltre possibile chiedere a Google, con questo stesso operatore, di limitare l’ambito della ricerca alle pagine Web dei siti di un certo paese o di uno specifico tipo di sito Internet. Per esempio, per cercare soltanto nei siti svizzeri* si può digitare in Google l’argomento cercato, seguito da

site:.ch

* In realtà non proprio tutti i siti svizzeri usano il suffisso ch: molti siti usano i suffissi .com e .org. Inoltre a partire dal 2015 è disponibile anche un suffisso .swiss.

Per limitare la ricerca all’insieme dei siti italiani (.it) si può specificare

site:.it

Anche qui non si devono lasciare spazi dopo il due punti. Si può anche usare la parola italiana sito al posto di site.



3.6. Pagine che linkano una data pagina


Se stiamo indagando su una particolare pagina del Web, possiamo chiedere a Google di elencarci quali pagine del Web la citano, per esempio per valutare la popolarità o la risonanza ottenuta dalla pagina sotto indagine o per risalire all’origine di una notizia seguendo la catena di pagine linkate fra loro.

Questo si ottiene usando l’operatore link: (senza spazio dopo il due punti), come in:

link:http://www.cancer.gov/cancertopics/factsheet/Risk/cellphones

Questa opzione di ricerca non ha una casella apposita nella pagina di ricerca avanzata.


3.7. Ricerche cronologiche o per intervalli numerici


Digitando una parola o frase seguita da un intervallo di numeri è possibile ottenere un elenco delle pagine che contengono quella parola o frase e che, secondo l’interpretazione di Google, si riferiscono a quell’intervallo di numeri. Per esempio,

“moria di pesci” 1980...1990

restituisce pagine che contengono la frase esatta “moria di pesci” e si riferiscono al decennio dal 1980 al 1990.

Un’altra maniera di usare quest’opzione è immettere un intervallo di prezzi.

Questa opzione di ricerca è accessible nella pagina di ricerca avanzata usando le caselle etichettate “numeri da...a”.



3.8. Ricerche per tipo di file


È possibile restringere una ricerca a uno specifico tipo di file (per esempio un documento Word o un foglio di calcolo Excel) usando l’operatore filetype: (incluso il due punti) seguito, senza spazi, dal suffisso standard di quel tipo di file:


  • PDF (Adobe Acrobat)
  • PS (PostScript)
  • DWF (Autodesk)
  • KML (Google Earth)
  • XLS (Excel)
  • PPT (PowerPoint)
  • DOC (Word)
  • RTF (testo)
  • SWF (Flash) 
  • e molti altri


Per esempio,

"curriculum vitae" site:aziendademo.com filetype:pdf

restituisce tutti i documenti in formato PDF ospitati in modo accessibile sul sito Aziendademo.com e contenenti l’esatta sequenza di parole “curriculum vitae”.

Nella pagina di ricerca avanzata si usa il menu a tendina “tipo di file”. Tuttavia questo menu non include tutti i tipi di file cercabili.


Esempio: reperimento di un documento disponibile ufficialmente solo a pagamento e su carta

Nel 2015 il giornalista italiano Pino Scaccia segnalò che era stato pubblicato un dossier di architetti e ingegneri che avrebbero scoperto una verità scottante e segreta sul crollo delle Torri Gemelle negli attentati dell’11 settembre 2001. Il dossier era disponibile soltanto a pagamento e su carta presso il sito dell’associazione fondata da questi architetti e ingegneri.

Ma l’uso degli operatori di Google (titolo del dossier fra virgolette per cercare la sequenza esatta di parole, seguito dalla specificazione filetype:pdf) mi permise di recuperarne online una copia digitale ed esaminarla gratuitamente e (cosa più importante) subito, invece di aspettare la spedizione intercontinentale della copia cartacea. La vicenda è raccontata in questo articolo.




3.9. Traduzione


Merita una segnalazione a parte l’operatore translate, che consente di tradurre una parola o frase direttamente in Google digitando per esempio

translate:"Mi scusi, dove posso trovare del pane?"

e ottenendo una pagina di Google che offre la traduzione in inglese per impostazione predefinita ma modificabile.

Questa funzione è utile per una traduzione rapida di una singola parola o frase: per le traduzioni di intere pagine o brani di testo più lunghi si può usare invece Translate.google.com.





4. Ricerca e recupero di documenti rimossi, modificati o nascosti; ricerca storica


Se un documento o una pagina Web precedentemente pubblicati su un sito sono stati poi rimossi o modificati, oppure sono inaccessibili a causa di un numero eccessivo di visitatori, spesso è possibile recuperarne lo stesso il contenuto utilizzando le copie cache e le copie archiviate.



4.1. Copia cache di una pagina o di un sito in Google


Quando Google esplora il Web per indicizzarlo, registra nei propri server una copia di ogni singola pagina esplorata. Questa è la copia cache di Google, che è consultabile in due modi:
  1. digitando in Google la parola cache: seguita (senza spazi) dal nome del sito o dall’indirizzo della pagina specifica desiderata;
  2. cliccando sul triangolo verde presente accanto a un normale risultato di ricerca, in modo da far comparire l’opzione copia cache.
La copia cache è utile perché mostra com’era una data pagina quando Google l’ha visitata e quindi costituisce una sorta di “eco” temporanea, che persiste anche se la pagina originale viene cambiata o addirittura rimossa. Questo consente di andare indietro nel tempo a vedere, per esempio, qual era il contenuto di un sito oscurato, sequestrato, alterato oppure rimosso.

Questa copia è utile anche quando desideriamo esplorare un sito senza lasciare traccia del nostro interessamento. Ogni normale visita a un sito, infatti, lascia all’amministratore del sito una serie di informazioni tecniche che permettono di identificare il visitatore. In alcuni casi può essere sconsigliabile, per esempio, che un giornalista sfogli, da un computer connesso alla rete della redazione, un sito sul quale sta indagando: i titolari del sito potrebbero accorgersi della visita e dedurne che è in corso un’inchiesta.



4.2. Copie archiviate


Oltre alla copia cache di Google ci possono essere altre copie archiviate presso altri siti:
Coralcdn.org e Archive.org sono siti che collezionano automaticamente una copia delle pagine Web di Internet (temporaneamente nel caso di Coralcdn.org, permanentemente nel caso di Archive.org), mentre Archive.is archivia in modo permanente solo le pagine che gli vengono richieste manualmente e fornisce un link breve utile per citare una copia permanente di un contenuto online.

Tipicamente:

  • la copia più recente è quella nella cache di Google;
  • quella di Coral è leggermente meno recente;
  • quella di Archive.is può risalire anche a vari anni fa;
  • e infine le copie multiple custodite presso Archive.org possono andare indietro nel tempo anche fino agli anni Novanta del secolo scorso.



Esempio: recupero del contenuto di un sito sottoposto a sequestro

Per ottenere un elenco dei siti sequestrati dalle autorità italiane si può usare l’operatore intitle di Google per cercare tutti i siti che hanno come titolo l’espressione standard usata in Italia in questi casi, ossia l’esatta sequenza di parole "sito sottoposto a sequestro". La sintassi della ricerca in Google diventa quindi:

intitle:"sito sottoposto a sequestro"

In Canton Ticino la dicitura può avere il formato “Il sito è stato oscurato per ordine della Magistratura del Cantone Ticino”, come in questo caso concreto.

A questo punto si sceglie un sito sequestrato fra quelli elencati da Google e si immette il suo link in Archive.org, che solitamente ne contiene una copia risalente a prima del sequestro. Questa copia consente di avere un’immagine del sito prima del sequestro, di fare ipotesi sulle ragioni del sequestro stesso e anche di determinarne la data approssimativa.



4.3. Ricerca e recupero di documenti confidenziali con Google


Talvolta le autorità o le aziende commettono l’errore di pubblicare su Internet, presso indirizzi non pubblicizzati, documenti che sono sotto embargo. Scaduto l’embargo, annunciano l’indirizzo al pubblico.

Tuttavia Google vede e indicizza anche quasi tutti i documenti pubblicati sui siti Web, anche se si trovano presso indirizzi non linkati o annunciati, per cui i documenti sono comunque già reperibili prima della fine dell’embargo se si immettono in Google le parole chiave pertinenti.

I documenti usano spesso diciture come le seguenti:

  • embargo oppure embargoed until seguito da una data
  • do not disseminate
  • strictement confidentiel
  • ne pas diffuser
  • ne pas devoiler
  • streng vertraulich
  • streng vertraulich und rechtlich geschützt



La ricerca di queste espressioni, specialmente se accompagnata da una data, dall’operatore site: che restringa la ricerca ai siti di un ente o di un’azienda e dall’operatore filetype:PDF e/o filetype:DOC (perché di norma i documenti vengono pubblicati come file PDF o DOC), produce spesso frutti inattesi.

Un esempio limite è dato da questa ricerca:

intext:password intext:username filetype:xls inurl:.xls

che trova i file contenenti elenchi di password incautamente custoditi in una cartella pubblica accessibile a Google. Al posto di inurl:.xls si può anche specificare inurl:.csv.

Un altro esempio altrettanto estremo è il seguente:

“Your password is * Remember this for later use”



4.4. Google Hacking vero e proprio


Le ricerche avanzate in Google possono essere utilizzate per rivelare dati e vulnerabilità informatiche di ogni sorta. Una delle fonti più ricche di suggerimenti di ricerca è il Google Hacking Database, che offre varie categorie di ricerche estremamente penetranti:

  • documenti sensibili
  • log di sicurezza
  • dispositivi connessi: stampanti, telecamere, impianti
  • nomi di utenti
  • password





5. Google: ricerca selettiva per tipo di pubblicazione


Google ha dei “sotto-motori” di ricerca specialistici estremamente preziosi:
  • Google Libri (books.google.com) limita la propria ricerca al vastissimo catalogo di libri e riviste che Google ha scansionato;
  • Google Scholar (scholar.google.com) è dedicato alle ricerche all’interno della letteratura accademica;
  • Google News (news.google.com) è dedicato alla ricerca nelle notizie pubblicate dai siti che Google ritiene testate giornalistiche e consente di scegliere la zona, il paese e la testata da seguire.
Google Scholar offre un menu di ricerca avanzata, ricco di parametri di filtraggio, cliccando sulle tre barre orizzontali in alto a sinistra nella sua schermata principale; queste tre barre portano anche alle opzioni che permettono all’utente di crearsi un profilo personalizzato (per monitorare le citazioni relative ad un articolo di una persona), di crearsi una biblioteca di riferimento, di generare avvisi automatici e di consultare le metriche di pubblicazione.

Google News consente di selezionare le aree linguistiche e geografiche. Per la ricerca di notizie, inoltre, si può usare la sezione Notizie della pagina iniziale di Google, che permette di selezionare le notizie cronologicamente (Ultima ora, Ultime 24 ore, Ultima settimana, Ultimo mese, Ultimo anno, Archivi e Intervallo di date).

Tutti e tre accettano quasi tutti i principali operatori di ricerca di Google.




    6. Google: ricerca meno personalizzata


    Per ridurre la personalizzazione e il filtraggio che Google applica ai risultati di ricerca ci sono due metodi di base:
    1. si può uscire dall’account Google;
    2. si può chiedere a Google la depersonalizzazione dei risultati.



    6.1. Navigazione privata: quasi inutile


    Spesso si crede che si possa eliminare il filtraggio personalizzato effettuato da Google se si usa la navigazione privata, ossia una particolare modalità del browser, che è accessibile per esempio come segue:
    • in Firefox e Safari, scegliendo File - nuova finestra privata;
    • in Microsoft Edge, scegliendo Altro (i tre puntini orizzontali) e poi Nuova finestra InPrivate;
    • in Internet Explorer, scegliendo Strumenti o Sicurezza - InPrivate Browsing;
    • in Chrome scegliendo l’icona delle impostazioni e poi Nuova finestra di navigazione in incognito.

    Tuttavia questa modalità di navigazione serve soltanto a non lasciare memoria dei siti visitati sul computer o in generale sul dispositivo che usiamo (durante la navigazione privata i siti visitati non vengono aggiunti alla cronologia, per esempio), non accumula cookie nuovi, che vengono eliminati alla chiusura della finestra di navigazione privata, ma fa poco o nulla per anonimizzare la navigazione, che è infatti perfettamente rilevabile e registrabile da parte del sito visitato e dal fornitore d’accesso alla Rete.



    6.2. Uscita dall’account Google


    Consultare Google quando non si è nel proprio account Google riduce la personalizzazione ma non la elimina del tutto: restano per esempio le personalizzazioni su base linguistica e geografica e (in parte) quelle basate sulla cronologia delle ricerche precedenti. Inoltre l’uscita dal proprio account implica la scomodità di non poter accedere ai servizi di Google (per esempio Gmail) fino a quando non si rientra nell’account.

    Per uscire dal proprio account Google si va a Google.com, si clicca sull’icona circolare della foto dell’utente (in alto a destra) e si sceglie Esci.



    6.3. Depersonalizzazione


    Anche se si esce dal proprio account Google, i risultati di ricerca di Google continuano a essere parzialmente personalizzati sulla base delle ricerche precedenti. Per disabilitare questa personalizzazione si può visitare questa pagina:


    dopo essere usciti dall’account e fare clic sul selettore accanto alla frase Attività di ricerca svolte senza avere eseguito l’accesso attive. Quest’impostazione vale per tutti gli utenti che utilizzano quel browser e quel computer fino a quando qualcuno esegue l’accesso al proprio account.

    Anche questo metodo, tuttavia, non è completamente risolutivo.



    6.4. Aggiramento del diritto all’oblio UE e delle personalizzazioni geografiche


    Alcuni casi di ricerche che portano a risultati coperti dal diritto all’oblio previsto dalle norme UE sono stati pubblicati presso Hiddenfromgoogle.com (che attualmente è vuoto ma i cui contenuti passati sono archiviati presso Archive.org) e dalla BBC. Questo diritto può essere un intralcio per un giornalista, un investigatore o un inquirente, perché gli nasconde risultati potenzialmente importanti.

    Esempio: rivelare i siti oscurati da Google in base al diritto all’oblio

    Tramite Hiddenfromgoogle.com sappiamo che c’è un articolo di Der Spiegel del 1995, intitolato Wie tausend Metastasen, che è stato rimosso dai risultati di Google in base alla normativa sul diritto all’oblio, per cui se si cerca in Google “Fred Anton” (tra virgolette) insieme a scientology o spiegel da un computer o dispositivo che si trova in UE (o in Svizzera), l’articolo di Der Spiegel che lo cita non compare tra i risultati. In compenso viene presentato un avviso: “Alcuni risultati possono essere stati rimossi nell’ambito della normativa europea sulla protezione dei dati”.

    È sufficiente cambiare la localizzazione apparente del computer da Svizzera a Hong Kong o a un’altra località extraeuropea, usando un proxy, una VPN o un servizio di tunnelling, oppure usare un altro motore di ricerca, come Bing, Yahoo o DuckDuckGo, per far comparire il link all’articolo tra i risultati. Questa tecnica è utile anche quando non è coinvolto il diritto all’oblio, dato che i vari motori di ricerca personalizzano i risultati in base all’ubicazione geografica dell’utente.

    Alcuni esempi di servizi a pagamento che offrono queste forme di “teletrasporto” virtuale sono Hidemyass.com, Tunnelbear.com (gratuito per i primi 500 MB mensili) e Freedome di F-Secure.

    In pratica, quando li usiamo, navighiamo in Rete come consueto, con l’unica differenza che il nostro luogo geografico di ingresso in Internet, agli occhi dei servizi di Internet e quindi anche a quelli dei motori di ricerca, è il luogo in cui si trova il servizio, non quello in cui si trova il nostro computer o tablet o smartphone.

    In molti casi è possibile scegliere esplicitamente il paese dal quale si vuol simulare di provenire: questo consente, fra l’altro, di accedere ai servizi che sono disponibili soltanto per gli utenti di quel paese (video “geobloccati”, siti oscurati dalle autorità, dati nascosti dal “diritto all’oblio”, e altro ancora). Il motore di ricerca restituisce quindi i risultati di ricerca che otterremmo se ci trovassimo nel paese in cui risiede il servizio di proxy/VPN/tunnelling che stiamo usando.

    Nel caso di Google, se sommiamo le depersonalizzazioni precedenti a questo ricollocamento geografico fittizio riusciamo a ridurre al minimo il controllo sui risultati di ricerca esercitato da questo motore.



    6.5. Verifica dell’elusione


    Per verificare che un servizio di proxy/VPN/tunnelling stia simulando correttamente una localizzazione differente da quella effettiva si possono usare servizi come Speedtest.net oppure Whatismyip.com, che mostrano sullo schermo l’informazione di localizzazione presunta.



    6.6. Sicurezza, tracciamento e anonimato


    Non tutti i servizi di proxy/VPN/tunnelling effettuano una cifratura dei dati trasmessi, per cui non è detto che la trasmissione sia protetta contro le intercettazioni da parte di provider ostili (problema frequente in alcuni paesi con regimi poco democratici) o di intrusi (problema frequente nelle reti Wi-Fi pubbliche). Se si desidera questo genere di protezione occorre consultare le specifiche del servizio e verificare che sia fornito.

    Inoltre, se si naviga usando un dispositivo mobile dotato di GPS, è possibile che alcuni siti (come per esempio Google) possano attingere alla posizione geografica indicata dal GPS e quindi rilevare la vera ubicazione dell’utente nonostante l’uso di sistemi di simulazione della localizzazione. Per questo è consigliabile disattivare il GPS del dispositivo durante la navigazione con localizzazione simulata.



    6.7. Tor come strumento di anonimato


    Tor Browser, disponibile gratuitamente presso Torproject.org, è un browser concepito per la navigazione sicura e anonima che ha molte funzioni utili al nostro scopo, come la cifratura forte e l’anonimizzazione della provenienza del traffico.

    In estrema sintesi, quando si usa Tor tutto il traffico di dati scambiato con Internet viene cifrato molto pesantemente e viene scomposto in parti, ciascuna delle quali viene affidata a un nodo Tor (un computer abilitato a ricevere e ritrasmettere i dati degli utenti di Tor Browser). Il nostro flusso di dati viene quindi passato ripetutamente da un nodo all’altro, rendendo estremamente difficile risalire alla sua origine reale, prima di uscire su Internet e raggiungere il sito desiderato. Per maggiore sicurezza è consigliabile combinare l’uso di Tor con l’impiego di una VPN.

    Usando Tor si beneficia della localizzazione fittizia prodotta dai nodi Tor; tuttavia normalmente non è possibile scegliere quale paese di provenienza si desidera simulare.




    7. Ricerche private nel Web e nel dark Web: Tor


    Il già citato Tor Browser consente di esplorare in modo riservato, sostanzialmente senza lasciare tracce, sia il Web tradizionale sia il dark Web. Si rivela quindi molto utile per “sopralluoghi” virtuali a siti da effettuare senza allertare i titolari oppure per lo scambio di comunicazioni riservate in ambienti a rischio. È il sistema usato da Edward Snowden per comunicare dati riservati dell’NSA al Washington Post e al Guardian.

    L’intera navigazione è cifrata e anonimizzata a vari livelli; tuttavia vanno evitati i comportamenti che possono rendere identificabile l’utente di Tor. Per esempio, è inutile usare Tor se poi si accede tramite Tor al proprio account su Amazon o su Google, perché il fatto stesso di accedervi con nome utente e password identifica il titolare dell’account.

    Inoltre il traffico cifrato di Tor può risaltare rispetto al traffico normale e quindi identificare l’utente: per esempio, se l’utente è l’unico che adopera Tor in una rete aziendale, l’amministratore della rete non farà fatica a dedurre chi è (non ne conoscerà le attività, ma capirà di chi si tratta).

    Una volta avviato il browser Tor, si può visitare The Hidden Wiki, che è l’indice dei servizi nascosti all’interno della rete Tor (l’indirizzo è variabile ma è reperibile su Google). The Hidden Wiki elenca anche i motori di ricerca, come Torch, che tentano di catalogare questa parte di Internet.

    Gli indirizzi dei siti della rete Tor sono caratterizzati dal suffisso .onion e da un nome costituito da lettere che non formano parole di senso compiuto.




    8. Simulazione di altri dispositivi


    Alcuni motori di ricerca e alcuni siti di Internet restituiscono risultati differenti anche in base al tipo di browser o sistema operativo o dispositivo utilizzato.

    Un esempio piuttosto celebre è quello dei siti per le prenotazioni dei voli, che offrono tariffe differenti in base al fatto che l’utente stia usando un Mac oppure un PC; un altro è costituito dai siti-truffa, che mostrano contenuti innocui se visitati con un normale computer ma presentano delle pagine-esca se visitati con uno smartphone.

    Si può eludere questa personalizzazione impostando un parametro del proprio browser, lo user agent, ossia il modo in cui il browser si identifica presso il sito visitato.

    Quando un browser visita un sito, gli passa infatti una serie d’informazioni sulla propria natura (nome e versione del browser, tipo di sistema operativo, dispositivo, lingua, eccetera). Il sito si fida delle informazioni ricevute, per cui è possibile impostare il browser per far credere al sito di essere visitato da un dispositivo diverso da quello reale (per esempio un iPhone quando in realtà si sta usando un PC Windows).

    La procedura d’impostazione varia da browser a browser: le istruzioni specifiche sono disponibili nella guida d’uso dei rispettivi browser. In Safari, per esempio, si va in Preferenze - Avanzate e si attiva Mostra menu Sviluppo nella barra dei menu. Fatto questo, la barra dei menu acquisisce una voce supplementare, Sviluppo, dalla quale si può scegliere lo user agent da simulare.




    9. Monitoraggio automatico con Google Alerts


    Presso www.google.com/alerts è possibile definire uno o più allarmi automatici contenenti una parola o una frase: quando Google incontra una pagina o un documento contenenti quella parola o frase, ne segnala l’indirizzo mandando una mail all’utente.

    Per esempio, per tenere d’occhio le novità su un modello di automobile della marca Tesla si può immettere "Tesla model 3" in Google Alerts.

    Questo è un sistema molto efficace ed efficiente per essere allertati quando viene menzionato in Rete il nome di una persona, di un prodotto o di un’opera artistica che si vuole tenere d’occhio.




    10. Motore di ricerca personalizzato con Google Custom Search Engine


    Presso cse.google.com/cse/all è possibile definire un motore di ricerca personalizzato, ossia una versione di Google che limita le sue ricerche a un insieme di siti specificato dall’utente.

    Per esempio, si può creare un motore di ricerca che prenda in considerazione soltanto i risultati riguardanti una rosa di siti di medicina ritenuti attendibili.

    Il motore è poi consultabile con le consuete modalità di Google: si immette una parola o una frase nella sua casella di ricerca e si visualizzano i risultati.




    11. Ricerche nei social network


    Oltre ai motori specialistici elencati qui sotto, vale la pena di segnalare anche questi motori che includono i risultati dei social network:
    • Pipl.com, che consente di effettuare ricerche contemporaneamente nel Web e nei principali social network in base a un indirizzo di mail, a un nome usato nei social network o a un numero di telefono.
    • SocialMention.com, che effettua ricerche nei blog, nelle piattaforme di microblogging (per esempio Twitter), ricerche per immagini e video ed effettua una “analisi del sentimento” riguardante l’argomento, il prodotto o la persona cercata.
    • Tagboard.com, che cerca gli hashtag contemporaneamente in Twitter, Facebook, Instagram, Google+ e Flickr. 
    • Buzzsumo.com (a pagamento), che effettua ricerche nei principali social network e genera statistiche.
    • Social-searcher.com, che esplora Facebook, Twitter, Instagram, Linkedin, Pinterest e Google+ e consente di attivare avvisi via mail (gratuiti) o monitoraggi più sofisticati (a pagamento).
    • Uvrx.com usa Google per cercare all’interno di Facebook, Twitter, Myspace, Linkedin, Plaxo, Bebo, Tumblr, Livejournal, Flickr e Google+.


    11.1. Ricerche in Facebook


    La funzione di ricerca estesa in Facebook è attivabile scegliendo l’inglese come lingua dell’interfaccia di Facebook e consente di cercare testi dei post, persone, foto, luoghi visitati, preferenze personali, pagine, gruppi, app ed eventi di chiunque abbia lasciato pubbliche queste informazioni, talvolta con risultati imbarazzanti.

    Si possono inoltre formulare delle ricerche molto mirate immettendole nella casella di ricerca di Facebook con una sintassi inglese analoga a quella dei seguenti esempi:
    • people/men/women who like [argomento/persona]
    • photos of [argomento/persona]
    • photos from [anno] that I liked
    • people/men/women who live in [località]
    È inoltre possibile filtrare i risultati di queste richieste per esempio in base alla data di pubblicazione, alla località taggata o al grado di amicizia.

    La ricerca di Facebook rispetta le impostazioni di privacy degli utenti, per cui un utente A, amico di un altro utente B, otterrà risultati riguardanti B differenti da chi non è amico di B. Ogni utente può effettuare ricerche nell’insieme dei contenuti che sono stati condivisi con lui o sono pubblici.

    Questa funzione è in continua evoluzione e sta diventando man mano più limitata. Al suo esordio nel 2013, invece, consentiva ricerche estremamente precise come queste:
    • Single women who live in [città] and are interested in dating
    • Photos liked by my friends that are from 2012
    • Men who like men and live in Teheran, Iran



    11.2. Ricerche in Instagram


    Instagram ha una propria casella di ricerca, nella quale si possono cercare persone (in base al nome e cognome o al nome utente), luoghi e hashtag.

    Ad aprile 2018, lo scandalo di Cambridge Analytica ha portato alla disattivazione di molti servizi di ricerca in Instagram più potenti, come Picodash.com, che consentivano di selezionare immagini e utenti in base alla geolocalizzazione.

    È tuttora possibile effettuare ricerche testuali in Instagram tramite Google usando l’operatore site:instagram.com.



    11.3. Ricerche in Twitter


    L’indice completo dei messaggi pubblici di Twitter è accessibile a tutti e si estende fino alle origini di Twitter, nel 2006. Può essere consultato in due modi:


    La ricerca semplice consente di cercare una parola o frase filtrando i risultati in base a vari parametri:

    • tweet scritti da chiunque o dagli account seguiti dall’utente che effettua la ricerca
    • tweet scritti ovunque o nelle vicinanze dell’utente
    • tweet “di qualità” in base al “filtro qualità” di Twitter
    • tweet più popolari
    • tweet più recenti
    • persone che menzionano le parole cercate nel proprio nome utente o nella proprie informazioni dell’account (mini-bio)
    • tweet contenenti foto
    • tweet contenenti video
    • tweet contenenti link a siti di notizie (etichetta “Notizie”)
    • tweet contenenti streaming video di Periscope (etichetta “Trasmissioni”)

    La ricerca avanzata consente invece di affinare i risultati in base a queste opzioni:
    • ricerca di parole in qualsiasi ordine
    • ricerca di sequenza esatta di parole
    • ricerca di almeno una delle parole elencate
    • esclusione di parole
    • ricerca di hashtag
    • selezione per lingua
    • selezione in base al mittente, al destinatario e agli utenti menzionati
    • selezione in base alla localizzazione
    • selezione per data
    I risultati presentati dalla ricerca avanzata possono essere anche filtrati ulteriormente applicandovi la ricerca semplice: basta prima effettuare una ricerca avanzata e poi selezionare i filtri nella schermata di risultati che compare.

    Le ricerche possono essere effettuate anche scrivendole direttamente nella normale casella di ricerca di Twitter usando una sintassi simile a quella di Google. Per esempio:
    • le virgolette racchiudono la sequenza esatta di parole
    • OR (in maiuscolo) indica che si desidera cercare qualunque tweet contenente una o l’altra o entrambe le parole o frasi separate da OR (per esempio, dentrificio OR pangolino presenterà tutti i tweet che menzionano il dentifricio oppure un pangolino o entrambi)
    • il segno “-” esclude una parola
    • il segno “#” restringe la ricerca agli hashtag (per esempio #fakenews)
    • il segno “@” restringe la ricerca ai tweet contenenti il nome utente indicato dopo il segno 
    • since: e until: indicano rispettivamente la data iniziale e finale del periodo nel quale cercare. La data è nel formato anno-mese-giorno.
    • from: specifica il mittente
    • to: specifica il destinatario
    • filter:follows (cerca solo nei tweet delle persone che seguono il mio account)
    • filter:link limita i risultati ai tweet contenenti link
    • filter:news limita i risultati ai tweet che linkano siti di notizie 
    • filter:images restringe la ricerca ai tweet contenenti immagini
    • filter:videos restrigne la ricerca ai tweet contenenti video
    • filter:replies limita i risultati ai tweet di risposta da un utente specificato a un altro utente specificato
    • near:“[località]” restringe la ricerca ai tweet la cui geolocalizzazione è nelle vicinanze di una certa località. È possibile specificare una distanza usando within: e un valore in miglia (mi) o chilometri (km): per esempio, giraffe near:Roma within:15km limita la ricerca ai tweet che menzionano giraffe postati entro 15 km da Roma. Questa opzione è attiva solo se l’account di chi cerca ha abilitato la propria geolocalizzazione.
    • geocode:[coordinate],[distanza] permette di specificare le coordinate geografiche e il raggio della localizzazione dei tweet
    • lang: specifica la lingua in base al suo codice di due lettere (it = italiano, en = inglese, de = tedesco, es = spagnolo, nl = olandese, pt = portoghese, eccetera)
    • min_retweets:[numero] specifica il numero minimo di retweet
    • min_faves:[numero] specifica il numero minimo di “mi piace”
    • min_replies:[numero] specifica il numero minimo di risposte
    • source:“[nome app]” limita la ricerca ai tweet inviati tramite una specifica applicazione. Alcuni esempi di nomi sono Twitter Lite, Twitterfeed, Tweetdeck. 

    Dopo tutti questi operatori non bisogna lasciare spazi. Gli operatori sono combinabili:


    Si possono inoltre usare le parentesi per raggrupparli, come in questo esempio:


    L’elenco ufficiale di operatori (meno completo di quello riportato qui) è consultabile cliccando sulla parola “operatori” nella pagina di ricerca semplice (twitter.com/search-home).

    Twicsy.com, invece, è un indice delle immagini pubblicate su Twitter e funziona come una sorta di cache, archiviando una copia delle immagini e permettendo ricerche per categorie o cronologie.

    Esempio: recupero di immagini cancellate da un account Twitter

    Nel 2014 numerosi giornali hanno pubblicato articoli (come Bundeshaus-Sekretärin twittert Nackt-Selfies (Blick), Freizügige Sekretärin verlässt Parlamentsdienste (NZZ), Selfie hot di una segretaria di palazzo federale, Tio.ch) sul caso di una donna, segretaria del Palazzo federale, che aveva pubblicato alcuni autoscatti intimi fatti nel suo ufficio.

    In seguito alla vicenda, la donna ha rimosso le immagini dal proprio account Twitter. La donna non è stata identificata per nome e le coordinate del suo account non sono state rese note dai media. Tuttavia uno dei giornali ha pubblicato una sua foto, con il volto debitamente anonimizzato, che è stato possibile ritrovare tramite la ricerca per immagini di Tineye.com. Da qui è stato possibile identificare il suo account Twitter e usare Twicsy per recuperare le immagini in questione e conoscere meglio il suo caso, ben più articolato di qualche foto intima.

    Followerwonk.com, infine, permette di esplorare in lungo e in largo gli account Twitter, per esempio immettendo parole chiave che definiscano una professione o una categoria e poi cercando, all’interno dei profili risultanti, chi ha scritto il maggior numero di tweet, chi ha il maggior numero di follower, chi ha l’account più vecchio e chi ha la “social authority” più alta.

    In Followerwonk si possono anche creare grafici che confrontano vari account, per scoprire quanti sono i follower condivisi e i followed (utenti seguiti dagli account analizzati) in comune, insieme a numerose statistiche, come la percentuale di retweet o di tweet contenenti un link. Nella sezione Analyze follower è possibile generare una mappa della distribuzione geografica e delle fasce d’età dei follower, mentre in Track followers si può produrre un grafico dell’evoluzione dei follower: quanti ne arrivano, quanti se ne vanno, gli orari nei quali sono maggiormente attivi, se sono uomini o donne, le lingue utilizzate e altro ancora. Alcuni di questi servizi possono richiedere un account a pagamento, specialmente se l’utente Twitter da analizzare ha un numero elevato di follower.




    12. Ricerche di e per immagini e video


    Tineye.com consente di cercare immagini sulla base di un’immagine campione ed è in grado di rilevarne anche versioni più grandi, troncate o manipolate.

    Esempio: il caso della presunta “escort”
    Nel 2011 Tio.ch ha pubblicato la storia di una donna del Luganese che dice che le sue foto provocanti “sono finite in un sito internazionale di escort. La ragazza ha giurato a 20minuti di non saperne nulla e ha riferito di essere vittima di hacker” che “hanno creato questa falsa identità” e ora è in corso una lotta “per far cancellare questi siti”.

    L'articolo era corredato da una di queste fotografie della donna, con il volto debitamente oscurato in modo da renderlo in teoria irriconoscibile. Ma Tineye ha trovato online la versione non mascherata e il sito internazionale di escort in questione, dal quale è stato possibile risalire al probabile numero di cellulare della donna.

    La ricerca per immagini di Google (images.google.com) e quella di Bing (bing.com/?scope=image) permettono di cercare immagini in base a una descrizione testuale oppure di sottoporre al motore di ricerca un’immagine campione per scoprire se esistono immagini simili.

    In Google esiste anche una pagina di ricerca immagini avanzata, presso www.google.com/advanced_image_search, che offre grosso modo gli stessi criteri di selezione offerti dalla ricerca avanzata testuale (sequenza esatta, esclusione, alternative) più altri criteri specifici per le immagini:
    • dimensioni
    • proporzioni (alta, quadrata, larga, panoramica)
    • colore (qualsiasi, a colori, in bianco e nero, trasparente, contenente un colore specifico)
    • tipo (volto, foto, clipart, disegno, animazione)
    • area geografica
    • sito o dominio ospitante
    • SafeSearch (filtraggio di immagini non adatte ai minori)
    • formato di file (JPG, GIF, PNG, BMP, SVG, WEBP, ICO)
    • diritti di utilizzo

    ImageRaider.com è simile a Tineye, ma offre in aggiunta un servizio di monitoraggio, allertando l’utente quando trova un sito che ha pubblicato un’immagine sufficientemente simile a quella che gli è stata data come campione.

    Karmadecay.com identifica soltanto le immagini pubblicate sul social network Reddit ed è utile per identificare l’origine di memi e immagini controverse.

    Esiste inoltre l’estensione per Google Chrome denominata RevEye Reverse Image Search, che consente di effettuare ricerche per immagini con un semplice clic in Google, Yandex, Bing, TinEye e Baidu.

    Per quanto riguarda i video, Youtube ha una funzione di ricerca molto sofisticata, che consente l’uso di operatori simili alla ricerca di Google:

    • intitle: ricerca solo nei titoli
    • +[parola]: parola che deve essere presente
    • -[parola]: parola da escludere
    • "[sequenza]": sequenza esatta di parole da cercare
    • *: parola jolly in una frase
    • [parola/frase], channels: ricerca solo nei canali
    • [parola/frase], show: ricerca solo nei programmi
    • [parola/frase], short: ricerca solo nei video fino a 4 minuti di durata
    • [parola/frase], long: ricerca solo nei video che durano almeno 20 minuti
    • [parola/frase], 4k: ricerca solo nei video in formato 4K
    • [parola/frase], HD: ricerca solo nei video in alta definizione
    • [parola/frase], cc: ricerca solo nei video con sottotitoli
    • [parola/frase], creativecommons: ricerca solo video sotto licenza Creative Commons
    • [parola/frase], 3D: ricerca solo nei video 3D
    • [parola/frase], live: ricerca solo nei video dal vivo
    • [parola/frase], purchased: ricerca solo nei video acquistati
    • [parola/frase], spherical: ricerca solo nei video con visuale a 360°
    • [parola/frase], hour / today / week / month / year: ricerca solo nei video pubblicati nell’ultima ora / oggi / questa settimana / questo mese / quest’anno
    Questi operatori sono combinabili tra loro, per esempio per ricerche come questa:

    "mark zuckerberg", today, HD

    La ricerca in Youtube consente anche di filtrare i risultati in base alla pertinenza, al numero di visualizzazioni e al numero di “mi piace”.

    L’importanza dei video nella disseminazione di disinformazione è tale che Amnesty International offre uno strumento apposito: il sito Youtube DataViewer, che estrae da un video di Youtube i seguenti dati:
    • la descrizione del video
    • l’ID del video
    • la data e l’ora di caricamento (UTC), utile per sapere quale versione è l’originale o se un video risale a prima della data dichiarata degli eventi mostrati
    • fotogrammi singoli, pronti per essere inviati alla ricerca per immagini di Google.




    13. Analisi forense di immagini


    Le immagini possono essere analizzate dal punto di vista tecnico tramite siti come Fotoforensics.com e Hackerfactor.com, ai quali è possibile inviare una foto per scoprire se è stata manipolata aggiungendo, deformando, ricolorando o sottraendo elementi.

    I dati tecnici delle fotografie, ossia i dati EXIF (tipo di fotocamera, data e ora di scatto, geolocalizzazione e altri), possono essere rivelati tramite siti come Exifdata.com.

    Esistono inoltre servizi professionali, come per esempio Tungstène (presso www.exomakina.fr), usati dalle testate giornalistiche, che svolgono analisi matematiche più approfondite sulle fotografie e consentono di rivelare ritocchi e correzioni spesso impercettibili anche per l’occhio esperto, come le “clonazioni” di porzioni di immagini.




    14. Motore di ricerca matematico: Wolfram Alpha


    Wolfram Alpha (www.wolframalpha.com) non è un motore di ricerca nel senso stretto del termine, perché non scandaglia e non cataloga le pagine di Internet ma usa invece delle fonti accademiche e commerciali selezionate. Tuttavia viene usato per scopi analoghi a quelli dei motori di ricerca tradizionali: in particolare viene adoperato per ottenere risposte a domande complesse.

    A patto di sapere l’inglese, lingua nella quale vanno immesse le domande, Wolfram Alpha ha capacità davvero notevoli. Ecco alcuni esempi di domande alle quali sa rispondere: non per nulla viene usato da Siri, l’assistente vocale dei dispositivi mobili Apple.
    • confronti fra oggetti usando l'operatore vs, come per esempio Earth vs Mars, France vs Germany
    • grafici matematici: graph sin t + cos (sqrt(3)t)
    • localizzazione su Internet: where am I? oppure un indirizzo IP
    • giorni mancanti a un evento: days until easter 
    • giorni fra due eventi: days from today to 5/2/12
    • calcoli di età relativa: How old was Paul McCartney on June 12, 1976? oppure Is Mick Jagger older than Bill Wyman?
    • generazione e valutazione di password: 8 character password
    • parole che iniziano con una certa lettera e finiscono con un’altra: English words starting with B and ending with F
    • classifiche: What is the third largest country in the world?
    • distanze correnti dei pianeti: distance between Pluto and Jupiter in km o distance between Earth and Venus in light seconds




    15. Ricerca e identificazione di brani musicali


    È possibile cercare e identificare brani musicali utilizzando gli appositi motori di ricerca, ai quali si fornisce un campione sonoro (originale o ricantato) del brano desiderato oppure il nome dell’artista e il titolo del brano, digitati o pronunciati ad alta voce nel microfono del computer o del telefonino.

    I principali motori di questo genere sono:




    16. Altri archivi e motori di ricerca specialistici


    • Informazioni sulle persone. Intelius.com è una società che offre verifiche d’identità e di reputazione ai consumatori e alle aziende, soprattutto nel campo degli incontri sentimentali e nel lavoro e principalmente per gli Stati Uniti.
    • Informazioni sulle aziende. Zefix.ch e Moneyhouse.ch offrono ricerche d’informazioni in base a nomi e cognomi di persone o nomi di aziende, con dettagli sulle loro attività, in Svizzera.
    • Proprietari di siti Internet. Whois.net e Domaintools.com consentono di sapere chi sono gli intestatari e gli amministratori di un sito Internet a partire dal nome del sito; offrono anche una ricerca cronologica degli intestatari passati.
    • Sicurezza informatica. Shodan.io è un potentissimo motore di ricerca per computer e altri dispositivi collegati a Internet; consente di trovare tipi specifici di dispositivi e di ottenere informazioni sul loro funzionamento per segnalare o prevenire violazioni di sicurezza.
    • Bitcoin e criptovalute. La casella di ricerca presso Blockchain.info permette di acquisire informazioni su uno specifico indirizzo bitcoin, sull’hash di una transazione o su un block number (esempio); Wallet Explorer e Chainalysis Reactor permettono di scoprire correlazioni fra wallet, per esempio in caso di estorsione (ransomware) e di creare documentazione chiara e comprensibile dei risultati.
    • Aviazione. FlightRadar24.com e FlightAware.com tracciano in tempo reale i voli commerciali di tutto il mondo; Aviation-Safety.net cataloga e archivia gli incidenti aerei; NTSB.gov è l’ente statunitense per la sicurezza dei trasporti che si occupa delle indagini sugli incidenti aerei.
    • Navigazione marittima. Marinetraffic.com e Vesselfinder.com consentono il tracciamento delle navi civili e la consultazione di informazioni che le riguardano.
    • Citazioni. Per verificare se una citazione celebre è reale, si può consultare Wikiquote.org, che ha un suo motore di ricerca interno.
    • Leggi. Findlaw.com offre informazioni legali e archivi di leggi, principalmente statunitensi, australiane, britanniche e canadesi; LexisNexis.com offre uno dei più grandi archivi al mondo di documenti legali statunitensi, francesi, australiani, canadesi, sudafricani e britannici.
    • Documenti riservati. Wikileaks.org pubblica dossier e archivi riservati provenienti da governi, eserciti, banche e imprese che rivelano violazioni delle leggi.
    • Brevetti. Presso Espacenet.com è disponibile un motore di ricerca specializzato per la documentazione brevettuale di tutto il mondo; anche Google consente la ricerca di brevetti se si dispone del numero di riferimento del brevetto desiderato.
    • Riviste scientifiche. Moltissime pubblicazioni mediche sono catalogate e cercabili presso PubMed.gov. ScienceDirect.com ospita circa 2500 riviste accademiche e oltre 26.000 libri digitali. IngentaConnect.com e OnlineLibrary.wiley.com sono altri due vasti archivio di pubblicazioni tecniche. CiteseerX (citeseer.ist.psu.edu) è un motore di ricerca dedicato al campo delle pubblicazioni scientifiche.




    17. Ricerche negli account Google


    Se si hanno le credenziali di un account Google è possibile effettuare ricerche al suo interno e vedere quante informazioni vengono raccolte da Google in cambio dei servizi che offre gratuitamente. È possibile effettuare ricerche per esempio in queste categorie principali:

    Questo è l’elenco completo delle categorie, tutte consultabili (se si hanno le credenziali dell’account) presso myactivity.google.com/item?product= seguito da un numero da 1 a 47, come elencato qui:

    3 commenti:

    barbagianni (°v°) ha detto...

    Ottimo lavoro. Complimenti

    Unknown ha detto...

    Preciso,incisivo e conciso; come sempre.

    annarita ha detto...

    Che dire? Complimenti e grazie!