removido
(usa Nenhuma)
Enviado em 22/03/2009 - 23:24h
Eu soube de duas razões. A primeira é para nenhum software de reconhecimento de imagem burlar o objetivo que é garantir que seja um humano tentando acessar determinada página ou arquivo. Saiba que alguns programas são capazes de reconhecer rostos humanos. Então, se fosse um texto certinho, isso seria mais fácil ainda.
A outra razão, é que alguns sites usam amostras retiradas de textos escaneados, dos quais alguns não foram reconhecidos pelo software que faz a transcrição. São aqueles casos onde uma palavra qualquer não passa numa lista de checagem no ato da digitalização de um livro. Então, de modo automático, um programa busca estes casos num banco de dados e expõe a expressão para um determinado número de usuários. Quando ela é reconhecida por um número "x" de pessoas, aquela palavra que foi digitada volta para o tal banco de dados e é finalmente incorporada ao texto escaneado. É uma forma de nos usar para conferir um trabalho, que de outro modo dependeria de centenas de pessoas ou milhares de horas de checagem.