skip to main | skip to sidebar
13 commenti

Lo strano caso della fotocopiatrice che falsifica le copie

La Ribellione delle Macchine è cominciata. Le fotocopiatrici non sono più schiave diligenti che ricopiano fedelmente quello che viene dato loro da duplicare. Da tempo, silenziosamente, pazientemente, hanno iniziato ad alterare subdolamente le fotocopie, scambiandone numeri qua e là, senza dare nell'occhio.

È la scoperta di un informatico tedesco: si è accorto che le copie prodotte da alcune fotocopiatrici della Xerox (e, si sospetta, anche di altre marche), se settate sulla modalità definita “normale”, cambiavano i numeri nei disegni tecnici, come nell'esempio qui accanto.

Immaginate quali possono essere le conseguenze di una fotocopia che riporta un dosaggio alterato di un farmaco o una misura sbagliata di un componente di precisione. Immaginate di andare in tribunale e cercare di giustificare la fatturazione falsa dicendo che la fotocopiatrice vi ha cambiato i dati. Buona fortuna.

Come è possibile? Semplice: qualche genio ha avuto l'idea brillante di introdurre un algoritmo lossy come opzione di scansione dei documenti. Questo, a casa mia, si chiama un epic fail. I dettagli sono qui.
Invia un commento
I commenti non appaiono subito, devono essere tutti approvati da un moderatore. Lo so, è scomodo, ma è necessario per tenere lontani scocciatori, spammer, troll e stupidi: siate civili e verrete pubblicati qualunque sia la vostra opinione; gli incivili di qualsiasi orientamento non verranno pubblicati, se non per mostrare il loro squallore.
Inviando un commento date il vostro consenso alla sua pubblicazione, qui o altrove.
Maggiori informazioni riguardanti regole e utilizzo dei commenti sono reperibili nella sezione apposita.
NOTA BENE. L'area sottostante per l'invio dei commenti non è contenuta in questa pagina ma è un iframe, cioè una finestra su una pagina di Blogger esterna a questo blog. Ciò significa che dovete assicurarvi che non venga bloccata da estensioni del vostro browser (tipo quelle che eliminano le pubblicità) e/o da altri programmi di protezione antimalware (tipo Kaspersky). Inoltre è necessario che sia permesso accettare i cookie da terze parti (informativa sulla privacy a riguardo).
Commenti
Commenti (13)
Il problema non è l'algoritmo lossy, peraltro anche JPEG è lossy. L'algoritmo è semplicmente un compressore a dizionario, il problema è che considera simili anche blocche che sono sufficientemente diversi per essere letti diversamente dall'uomo, quindi un semplice baco che però ha degli effetti notevoli.
Resta però un enigma di fondo: capire quale forma bizzarra di pensiero ha spinto le case produttrici di fotocopiatrici a introdurre, in un apparecchio il cui scopo fondamentale è creare copie fedeli e affidabili, un sistema di compressione che produce copie alterate.

La semplice stupidità?
Questo commento è stato eliminato dall'autore.
Io già prefiguro un futuro alla "Matrix", dove "Il Prescelto" dovrà andare alla "Sorgente" e togliere "Il Cassetto del Toner" alla macchina a capo della ribellione... Naturalmente sconfiggendo i temutissimi "Agenti" dispiegandoli o pinzadoli assieme, in quanto fatti di "Origami" ed evitando con mosse di limbo al rallenty le pericolosissime "Palline di Carta", vera e propria arma di distruzione di massa dei pochi umani superstiti...

Il film che ne verrà tratto si chiamerà "Fotocopiatrix".
Io prefiguro piuttosto, non appena qualche studio legale di New York avrà sentore della cosa, una "class action" con richiesta di danni a livello di miliardi. E in tribunale, la Xerox - qualsiasi cosa faccia adesso - sarà senza dubbio condannata.
Quasi quasi Lunedì provo a fare un test su quella al lavoro (che è fotocopiatrice, scanner, e fax): tanto siamo già da neurodeliri anche senza fotocopiatrici impazzite! ;-)
Bè in modalità di scansione su PDF/JPEG è normale che il file venga compresso.
Oltretutto, il problema si verifica sul settaggio "normale" riguardo alla qualità dell'output.
Se a qualcuno serve un PDF/JPEG super fedele, è giusto che si premuri di selezionare una qualità alta dell'output.
Con settaggi di default la macchina comprime e si possono perdere informazioni, non c'è da stupirsi.
Qui si parla di planimetrie di costruzioni/edifici...quindi un pò di attenzione ci sarebbe dovuta essere...o si sarebbe dovuto selezionare un diverso formato di uscita come il TIFF, ad esempio.
Fanno una cosa simile, anche se giustificato e raro (a me è capitato una volta sola), anche le multifunzioni da ufficio quando si seleziona PDF con OCR. Nel caso specifico mi ha cambiato una parola, proponendone una inesistente. Il problema è risolto selezionando PDF/Jpeg.

@Fulvio Molinengo
Non è un errore dell'operatore. Si sta parlando di una fotocopiatrice, quindi ci si aspetta che cambi la qualità finale, non che il documento venga riprodotto con fantasia. E' proprio un errore di programmazione o di progetto, dato che non vedo perchè una fotocopiatrice debba elaborare l'immagine; la deve semplicemente stampare, così come è!
@giubbe : non è stata una semplice fotocopia, è stata una digitalizzazione (non è chiaro se in PDF o JPEG).
In modalità di copia la macchina non elabora alcunchè, giustamente.
l'hanno fatto perché quando le signore copiano la carta d'identità le vengono scalati degli anni...
Non ci posso credere, chi ha pensato questa tecnica è un genio del male!
Questo paragrafo sul sito ufficiale dello standard JBIG2 aiuta IMO a fare chiarezza sulla vicenda:

http://jbig2.com/jb2com_compression_connection.html#lossy

Cito (il grassetto è mio):

The problem with lossy JBIG2 is that some implementations are exactly that -lossy. Lossy JBIG2, implemented naively by an unqualified vendor, may significantly degrade image quality. In many document management applications with record retention policies, such as mortgage banking and medical fields, lossy JBIG2 coding is problematic and must be used with caution. A lossy JBIG2 file encoding may result in significant image artifacts and degraded text recognition rates, e.g., fewer word hits when the file is converted to text using an OCR program.

While lossy compression offers superior compression to lossless JBIG2, for many corporate and professional users the loss of document integrity would not be worth the tradeoff. Yet when utilized properly, the techniques of lossy compression can actually improve image quality. With a proper JBIG2 implementation you can drastically reduce file size even as you create a cleaner, more readable document.


Mi sembra ragionevole concludere che implementare il jbig2 lossy in macchine fotocopiatrici (che si tratti di copia fisica o digitale - pdf o file immagine - è irrilevante dal punto di vista dell'utente) sia stata una scelta di progetto errata, oppure che sia stata implementata in modo non corretto per il tipo di dispositivo.
Dopo qualche anno il link indicato da Paolo non punta più all'articolo con maggiori dettagli. E' comunque disponibile (almeno a oggi) l'analisi dettagliata e la ricostruzione dei fatti dello scopritore del bug: http://www.dkriesel.com/en/blog/2013/0802_xerox-workcentres_are_switching_written_numbers_when_scanning