Cerca nel blog

2005/10/16

Accidenti ai filtri antispam stupidi

Grazie alla poca furbizia di certi filtri antispam, compresi quelli di Symantec Mail Security, la newsletter che ho appena spedito è stata classificata e scartata come spam da molti provider e da molte reti aziendali.

Il motivo? Riassumeva gli articoli pubblicati in questo blog nei giorni scorsi, e conteneva due parole citate come esempio di prodotti venduti dagli spammer: "Viagra" e "Rolex". Conteneva anche molte altre informazioni, ma ai filtri è bastato trovare quelle due parole per cestinare tutto.

Il bello è che i destinatari della newsletter (tutta gente che ha chiesto di riceverla) non si accorgeranno nemmeno che sono stato "censurato". E' un esempio molto chiaro di come sia alto il potenziale dei filtri antispam come sistemi di censura. Un messaggio contiene una parola sgradita al Potente Di Turno, per esempio "democrazia", come in Cina? Nessun problema: grazie al filtro antispam, il messaggio offensivo non esiste.

E' anche un esempio lampante di come l'accanimento eccessivo e soprattutto poco intelligente (che fine hanno fatto i filtri bayesiani, così efficaci?) contro lo spam renda impossibili anche le attività legittime. Come fa, per esempio, una newsletter di orologiai di discutere di Rolex, o una newsletter di urologi di parlare di Viagra?

Va da sé che anche questo articolo, come quello precedente, non potrà essere distribuito nella newsletter perché verrebbe censurato dal filtro antispam. Andiamo bene.

8 commenti:

Gacattos ha detto...

Il sito di Virgilio.tin.it ha lasciato passare la tua mail senza censurarla.
I filtri Bayesiani sono finiti, quanto meno, in Foxmail il client di posta
che sto usando con grande soddisfazione.

Francesco Rinarellipfgqmyi ha detto...

Veramente a me non risulta che i filtri "bayesiani" (in verità una catalogazione un po' rozza delle tecniche di machine learning applicate al filtraggio spam) siano stati messi in soffitta. Tendenzialmente i filtri odierni - compreso foxmail! - utilizzano sia euristiche tipo Bayes che le classiche regole. Può sempre darsi, comunque, che ci siano errori di classificazione, sia con filtri bayesiani che con qualsiasi altra tecnica.

EtHeReAl ha detto...

Per fortuna Thunderbird può contare su un filtro bayesiano, infatti io l'ho ricevuta correttamente stamattina alle 9...

Anonimo ha detto...

Io uso Gmail e devo dire che il filtro antispam è perfetto. Se sbadatamente come è accaduto mi filtrasse qualcosa che non è spam basta che glielo dico con un semplice click. C'è da dire che i prodotti Google sono fatti ad arte.

Da www.thebug.de

Anonimo ha detto...

come avete fatto ad addestrare foxmail con i filtri bayesiani?
a me richiede mille messagi di spam per imparare e fortunatamente non ci sono ancora arrivato.

Gacattos ha detto...

Addestrare Foxmail? Non credo sia una cosa tanto facile. Non mi sono mai posto il problema. In realtà virgilio.tin.it almeno su linee a pagamento, ha un filtro antivirus ed un filtro antispam. Ogni tanto vado a vedere in webmail e trovo la cartella spam ingolfata dei più strani messaggi. Quelli che passano li spammo manualmente. Grazie alla funzione "Remota" scarico le sole intestazioni dei messaggi che si vedono per l'intera estensione volendo, (cosa questa che non ho visto fare a nessun altro client di posta - l'intera estensione intendo). Poi posso scegliere tra 4 diverse opzioni: Elimina/Lascia/ Scarica/Scarica+Elimina ovvero clicco su un messaggio e poi sul comando che voglio su un'altro messaggio e sul comando che voglio.............alla fine dò comado esegui e Foxmail fa quello che deve fare. Grandioso! Un quasi Imap-4 su un Pop-3

Gacattos ha detto...

P.S: al mio precedente messaggio di pochi minuti fa: Il poter vedere l'estensioni interamente permette di rendersi conto - mettiamo si riceva un messaggio da donnanuda.eu di verificare se il mittente indicato corrisponde all'autenticazione scritta dal server circa il mittente stesso.
Metti caso che nell'autenticazione trovassi scritto donnanuda.eu autenticato come mandrillaccio.af
ne deusumerei che il mittente è stato camuffato. Conseguentemente darei comando di cancellazione del mandrillaccio e di eventuali allegati allo stesso. Per la facilità del camuffamento dei mittenti basta leggere l'Acchiappavirus di Paolo.

Heather82 ha detto...

Paolo, inizia a usare il leet per le parole da cifrare... :-))