Cerca nel blog

2007/10/23

Recaptcha, lettere deformate a fin di bene

Le lettere deformi dei captcha usate per digitalizzare interi libri


Avete presente quelle lettere tutte deformate e puntinate usate da tanti siti per assicurarsi che l'utente che sta interagendo col sito sia una persona reale e non un programma automatico? Si chiamano Captcha, e molti le considerano scocciature inutili.

C'è però chi ha trovato il modo di trasformare una scocciatura in un gesto utile: è Recaptcha.net, che offre un servizio nel quale i captcha non sono lettere casuali, ma sono parole tratte da libri acquisiti con lo scanner, che pero' sono troppo sbiaditi o stampati male per poter essere interpretati da un programma di riconoscimento del testo.

Così quando si digita un captcha gestito tramite il servizio Recaptcha, come quelli di Twitter, si interpreta una parola di un libro. Tutti insieme, questi captcha immessi da migliaia di utenti finiscono per digitalizzare l'intero testo del libro.

13 commenti:

Mazzolator ha detto...

Mi sembra strano.
Se un sito mette un captcha, vuole verificare se una persona e' presente. Per fare cio', verifica se quello che la persona scrive e' uguale alla parola originaria.
Ma se la parola e' ancora sconosciuta, come fa il sito a sapere se la parola e' giusta?

Armando ha detto...

ma come fa a sapere che la parola che hai scritto tu corrisponde all'immagine, se non è mai stato associato? mah!

Unknown ha detto...

La parola potrebbe essere verificata se più utenti danno la stessa risposta ma questo richiede tempo e se nessuno altro legge la mia parola?
Ho visto che usano due parole forse una è già stata verificata e l'altra no

Paolo ha detto...

Ecco come fanno:

But if a computer can't read such a CAPTCHA, how does the system know the correct answer to the puzzle? Here's how: Each new word that cannot be read correctly by OCR is given to a user in conjunction with another word for which the answer is already known. The user is then asked to read both words. If they solve the one for which the answer is known, the system assumes their answer is correct for the new one. The system then gives the new image to a number of other people to determine, with higher confidence, whether the original answer was correct.

Ok, molto bello. Ora siccome sono simpatico mi metto a fare un bel giochino: rispondo con una parola giusta e l'altra cannata, ho il 50% di probabilita' che la mia parola giusta sia quella di verifica, e che quella cannata vada nell'archivio :D

Luigi Rosa ha detto...

Paolo, quello che descrivi tu e' assimilabile al "dilemnma del prigioniero" della teroia dei giochi. Non c'e' nessuna garanzia che tu dia la risposta esatta.

pb ha detto...

credo che poi sarà molto divertente leggere questo libro digitalizzato in tal modo. :D

Daniele Rongione ha detto...

Paolo, l'ultima frase del testo che hai citato spiega come evitare che qualcuno usi il tuo "giochino": "The system then gives the new image to a number of other people to determine, with higher confidence, whether the original answer was correct."

La stessa immagine viene data ad altre persone e la riposta scritta più volte sarà quella considerata corretta.

Paolo ha detto...

Esatto, non c'e' garanzia che io dia la risposta esatta, il sistema mi dice quando ho "beccato" la parola di controllo, e almeno un paio di volte sono già riuscito a far passare la parola sbagliata :D

Certo il sistema di riscontro sulla numerosità delle risposte giuste renderà ben presto la mia bravata inutile, ma se un gruppo folto di persone si mettesse d'accordo...

Unknown ha detto...

Bellissima idea...

il Braccini ha detto...

geniale!

federico ha detto...

così uno deve trovare DUE parole anziché una, cioé doppia scocciatura. Comunque il tuo articolo non era chiaro: meno male che paolo ha chiarito!

tcp-ip ha detto...

Il tutto però mi sembra un po' buggato: ho provato ad immettere tutte e due le parole sbagliate e me le ha accettate pi di una volta.

Dan ha detto...

Certo, e poi la domenica vi mettete d'accordo e andate a togliere le rampe per gli handicappati e scambiare i cartelli stradali, così, tanto per passare il tempo in compagnia...
In realtà il sistema sarebbe concepito per fare affidamento sulla buona volontà degli utenti che partecipano e aiutano, mettersi a sabotarlo appositamente mi sembra vandalismo fatto tanto per fare. O cerchi di "testare" l'affidabilità del metodo?