Cerca nel blog

2013/08/09

Lo strano caso della fotocopiatrice che falsifica le copie

La Ribellione delle Macchine è cominciata. Le fotocopiatrici non sono più schiave diligenti che ricopiano fedelmente quello che viene dato loro da duplicare. Da tempo, silenziosamente, pazientemente, hanno iniziato ad alterare subdolamente le fotocopie, scambiandone numeri qua e là, senza dare nell'occhio.

È la scoperta di un informatico tedesco: si è accorto che le copie prodotte da alcune fotocopiatrici della Xerox (e, si sospetta, anche di altre marche), se settate sulla modalità definita “normale”, cambiavano i numeri nei disegni tecnici, come nell'esempio qui accanto.

Immaginate quali possono essere le conseguenze di una fotocopia che riporta un dosaggio alterato di un farmaco o una misura sbagliata di un componente di precisione. Immaginate di andare in tribunale e cercare di giustificare la fatturazione falsa dicendo che la fotocopiatrice vi ha cambiato i dati. Buona fortuna.

Come è possibile? Semplice: qualche genio ha avuto l'idea brillante di introdurre un algoritmo lossy come opzione di scansione dei documenti. Questo, a casa mia, si chiama un epic fail. I dettagli sono qui.

13 commenti:

Vihai Varlog ha detto...

Il problema non è l'algoritmo lossy, peraltro anche JPEG è lossy. L'algoritmo è semplicmente un compressore a dizionario, il problema è che considera simili anche blocche che sono sufficientemente diversi per essere letti diversamente dall'uomo, quindi un semplice baco che però ha degli effetti notevoli.

martinobri ha detto...

Resta però un enigma di fondo: capire quale forma bizzarra di pensiero ha spinto le case produttrici di fotocopiatrici a introdurre, in un apparecchio il cui scopo fondamentale è creare copie fedeli e affidabili, un sistema di compressione che produce copie alterate.

La semplice stupidità?

Stupidocane ha detto...
Questo commento è stato eliminato dall'autore.
Stupidocane ha detto...

Io già prefiguro un futuro alla "Matrix", dove "Il Prescelto" dovrà andare alla "Sorgente" e togliere "Il Cassetto del Toner" alla macchina a capo della ribellione... Naturalmente sconfiggendo i temutissimi "Agenti" dispiegandoli o pinzadoli assieme, in quanto fatti di "Origami" ed evitando con mosse di limbo al rallenty le pericolosissime "Palline di Carta", vera e propria arma di distruzione di massa dei pochi umani superstiti...

Il film che ne verrà tratto si chiamerà "Fotocopiatrix".

ebonsi ha detto...

Io prefiguro piuttosto, non appena qualche studio legale di New York avrà sentore della cosa, una "class action" con richiesta di danni a livello di miliardi. E in tribunale, la Xerox - qualsiasi cosa faccia adesso - sarà senza dubbio condannata.

Maria Rosa ha detto...

Quasi quasi Lunedì provo a fare un test su quella al lavoro (che è fotocopiatrice, scanner, e fax): tanto siamo già da neurodeliri anche senza fotocopiatrici impazzite! ;-)

Fulvio Molinengo ha detto...

Bè in modalità di scansione su PDF/JPEG è normale che il file venga compresso.
Oltretutto, il problema si verifica sul settaggio "normale" riguardo alla qualità dell'output.
Se a qualcuno serve un PDF/JPEG super fedele, è giusto che si premuri di selezionare una qualità alta dell'output.
Con settaggi di default la macchina comprime e si possono perdere informazioni, non c'è da stupirsi.
Qui si parla di planimetrie di costruzioni/edifici...quindi un pò di attenzione ci sarebbe dovuta essere...o si sarebbe dovuto selezionare un diverso formato di uscita come il TIFF, ad esempio.

giubbe ha detto...

Fanno una cosa simile, anche se giustificato e raro (a me è capitato una volta sola), anche le multifunzioni da ufficio quando si seleziona PDF con OCR. Nel caso specifico mi ha cambiato una parola, proponendone una inesistente. Il problema è risolto selezionando PDF/Jpeg.

@Fulvio Molinengo
Non è un errore dell'operatore. Si sta parlando di una fotocopiatrice, quindi ci si aspetta che cambi la qualità finale, non che il documento venga riprodotto con fantasia. E' proprio un errore di programmazione o di progetto, dato che non vedo perchè una fotocopiatrice debba elaborare l'immagine; la deve semplicemente stampare, così come è!

Fulvio Molinengo ha detto...

@giubbe : non è stata una semplice fotocopia, è stata una digitalizzazione (non è chiaro se in PDF o JPEG).
In modalità di copia la macchina non elabora alcunchè, giustamente.

Guido DR ha detto...

l'hanno fatto perché quando le signore copiano la carta d'identità le vengono scalati degli anni...

Christian Brasolin ha detto...

Non ci posso credere, chi ha pensato questa tecnica è un genio del male!

MR ha detto...

Questo paragrafo sul sito ufficiale dello standard JBIG2 aiuta IMO a fare chiarezza sulla vicenda:

http://jbig2.com/jb2com_compression_connection.html#lossy

Cito (il grassetto è mio):

The problem with lossy JBIG2 is that some implementations are exactly that -lossy. Lossy JBIG2, implemented naively by an unqualified vendor, may significantly degrade image quality. In many document management applications with record retention policies, such as mortgage banking and medical fields, lossy JBIG2 coding is problematic and must be used with caution. A lossy JBIG2 file encoding may result in significant image artifacts and degraded text recognition rates, e.g., fewer word hits when the file is converted to text using an OCR program.

While lossy compression offers superior compression to lossless JBIG2, for many corporate and professional users the loss of document integrity would not be worth the tradeoff. Yet when utilized properly, the techniques of lossy compression can actually improve image quality. With a proper JBIG2 implementation you can drastically reduce file size even as you create a cleaner, more readable document.


Mi sembra ragionevole concludere che implementare il jbig2 lossy in macchine fotocopiatrici (che si tratti di copia fisica o digitale - pdf o file immagine - è irrilevante dal punto di vista dell'utente) sia stata una scelta di progetto errata, oppure che sia stata implementata in modo non corretto per il tipo di dispositivo.

Marco Salvalaggio ha detto...

Dopo qualche anno il link indicato da Paolo non punta più all'articolo con maggiori dettagli. E' comunque disponibile (almeno a oggi) l'analisi dettagliata e la ricostruzione dei fatti dello scopritore del bug: http://www.dkriesel.com/en/blog/2013/0802_xerox-workcentres_are_switching_written_numbers_when_scanning