|
Recaptcha, lettere deformate a fin di bene 23.10.07 Permalink 13 commenti
Le lettere deformi dei captcha usate per digitalizzare interi libri
Avete presente quelle lettere tutte deformate e puntinate usate da tanti siti per assicurarsi che l'utente che sta interagendo col sito sia una persona reale e non un programma automatico? Si chiamano Captcha, e molti le considerano scocciature inutili.
C'è però chi ha trovato il modo di trasformare una scocciatura in un gesto utile: è Recaptcha.net, che offre un servizio nel quale i captcha non sono lettere casuali, ma sono parole tratte da libri acquisiti con lo scanner, che pero' sono troppo sbiaditi o stampati male per poter essere interpretati da un programma di riconoscimento del testo.
Così quando si digita un captcha gestito tramite il servizio Recaptcha, come quelli di Twitter, si interpreta una parola di un libro. Tutti insieme, questi captcha immessi da migliaia di utenti finiscono per digitalizzare l'intero testo del libro.
Articoli che linkano questo articolo:
Commenti:
Se un sito mette un captcha, vuole verificare se una persona e' presente. Per fare cio', verifica se quello che la persona scrive e' uguale alla parola originaria.
Ma se la parola e' ancora sconosciuta, come fa il sito a sapere se la parola e' giusta?
Ho visto che usano due parole forse una è già stata verificata e l'altra no
But if a computer can't read such a CAPTCHA, how does the system know the correct answer to the puzzle? Here's how: Each new word that cannot be read correctly by OCR is given to a user in conjunction with another word for which the answer is already known. The user is then asked to read both words. If they solve the one for which the answer is known, the system assumes their answer is correct for the new one. The system then gives the new image to a number of other people to determine, with higher confidence, whether the original answer was correct.
Ok, molto bello. Ora siccome sono simpatico mi metto a fare un bel giochino: rispondo con una parola giusta e l'altra cannata, ho il 50% di probabilita' che la mia parola giusta sia quella di verifica, e che quella cannata vada nell'archivio :D
La stessa immagine viene data ad altre persone e la riposta scritta più volte sarà quella considerata corretta.
Certo il sistema di riscontro sulla numerosità delle risposte giuste renderà ben presto la mia bravata inutile, ma se un gruppo folto di persone si mettesse d'accordo...
In realtà il sistema sarebbe concepito per fare affidamento sulla buona volontà degli utenti che partecipano e aiutano, mettersi a sabotarlo appositamente mi sembra vandalismo fatto tanto per fare. O cerchi di "testare" l'affidabilità del metodo?
<< Home








