한국   대만   중국   일본 
CAPTCHA ? Wikipedia, a enciclopedia livre Saltar para o conteudo

CAPTCHA

Origem: Wikipedia, a enciclopedia livre.
Este CAPTCHA de "smwm" distorce a mensagem para evitar a interpretacao automatica por computadores. Entretanto, programas foram desenvolvidos para ler este tipo de CAPTCHA. [ 1 ]

CAPTCHA e um acronimo da expressao " Completely Automated Public Turing test to tell Computers and Humans Apart " ( teste de Turing publico completamente automatizado para diferenciacao entre computadores e humanos): um teste de desafio cognitivo, utilizado como ferramenta antispam, desenvolvido de forma pioneira na universidade de Carnegie-Mellon. [ 2 ] Como o teste e administrado por um computador, em contraste ao teste de Turing padrao que e administrado por um ser humano, este teste e na realidade corretamente descrito como um teste de Turing reverso .

Um CAPTCHA usual envolve um computador (um servidor) que pede que um usuario termine um teste. Como os computadores sao incapazes de resolver o CAPTCHA, todo usuario que incorpora uma solucao correta e presumidamente humano. O termo foi inventado em 2000 por Luis von Ahn , por Manuel Blum , Nicholas J. Hopper (todos da universidade do Carnegie-Mellon), e por John Langford (da IBM ).

Um tipo comum de CAPTCHA requer que o usuario identifique as letras de uma imagem distorcida, as vezes com a adicao de uma sequencia obscurecida das letras ou dos digitos que apareca na tela.

Um CAPTCHA moderno. Ao inves de tentar criar um fundo distorcido e niveis elevados de distorcao do texto, este CAPTCHA procura dificultar a segmentacao adicionando uma linha angular

Atualmente, o reCAPTCHA e recomendado pelos criadores de CAPTCHA como a implementacao oficial. [ 3 ]

Aplicacoes [ editar | editar codigo-fonte ]

CAPTCHAs sao utilizados para impedir que softwares automatizados executem acoes que degradam a qualidade do servico de um sistema dado, devido a despesa do abuso ou do recurso. Embora CAPTCHAs sejam utilizados mais frequentemente como uma resposta a protecao de interesses comerciais, a nocao que existem para parar somente spammers e um erro, ou uma simples reducao.

CAPTCHAs pode ser desdobrado para proteger os sistemas vulneraveis ao Spam de E-mail , tal como os servicos do AOL Webmail, do GMail , do Hotmail, e do Yahoo. Sao tambem ativamente utilizados para limitar e controlar o acesso automatizado aos blogs ou os foruns, em consequencia de promocoes comerciais, ou de vandalismo. CAPTCHAs servem tambem a uma funcao importante no controle da taxa limite, como o uso automatizado de um servico pode ser desejavel ate que tal uso esteja sendo realizado em excesso, e em detrimento de usuarios humanos. Em tal caso, um CAPTCHA pode reforcar politicas automatizadas do uso como ajusta-se pelo administrador quando determinadas medidas do uso excedem um ponto inicial dado.

CAPTCHA e tambem o mecanismo sugerido para impedir listas automatizadas em placares e em votacoes de discussao publica. Um estudo por Arora e outros descreveu os vulnerabilidades nos varios foruns publicos que nao usam este tipo de teste (incluindo a BBC ).

Caracteristicas [ editar | editar codigo-fonte ]

Um sistema de CAPTCHAs consiste em meios automatizados de gerar novos desafios que os computadores atuais sao incapazes de resolver exatamente, mas a maioria de seres humanos podem resolver. [ 3 ] Um CAPTCHA nao confia nunca no atacante que conheca previamente o desafio. Por exemplo, um checkbox "clique aqui se voce e um bot" pode servir para distinguir entre seres humanos e computadores, mas nao e um CAPTCHA porque confia no fato que um atacante nao precisa se esforcar para quebrar esse formulario especifico. Para ser um CAPTCHA, um sistema deve gerar automaticamente os novos desafios que requerem tecnicas da inteligencia artificial na resolucao.

Na pratica, o algoritmo usado para criar o CAPTCHA nao necessita ser publico, mas pode ser coberto por uma patente. Embora a publicacao possa ajudar a demonstrar que a resolucao requer a solucao a um problema dificil no campo da inteligencia artificial, reter deliberadamente o algoritmo pode aumentar a integridade de um jogo limitado dos sistemas (ver a seguranca por meio do obscurecimento ). O fator mais importante em decidir se um algoritmo deve ser feito aberto ou restrito e o tamanho do sistema. Embora um algoritmo que sobrevivesse a investida por peritos de seguranca pudesse ser escolhido por ser conceitualmente mais seguro do que o algoritmo nao validado, por outro lado apostar em um algoritmo desconhecido e sempre menos interessante aqueles que apostam no abuso automatizado. Quebrar um CAPTCHA requer geralmente algum esforco especifico aquele implementacao em particular, e um abusador pode decidir-se que o beneficio concedido pelo desvio automatizado e inviavel pelo esforco requerido para engajar no abuso desse sistema em primeiro lugar.

Historia [ editar | editar codigo-fonte ]

A primeira discussao acerca dos testes automatizados que distinguem seres humanos dos computadores com objetivo de controlar o acesso aos servicos da web aparece em um manuscrito 1996 de Moni Naor do instituto de Weizmann de ciencia, intitulado "Verification of a human in the loop, or Identification via the Turing Test" (verificacao de um ser humano no laco, ou identificacao atraves do teste de Turing).

CAPTCHAs primitivos parecem ter sido desenvolvido mais tarde, em 1997, para o site de procura AltaVista por Andrei Broder e seus colegas para impedir que os bots adicionassem URLs a sua Ferramenta de Busca. Procurando uma maneira fazer suas imagens resistentes ao ataque do OCR , Optical Character Recognition (Reconhecimento Optico de Caracteres), a equipe olhou o manual de scanner, obtendo recomendacoes para melhorar os resultados do OCR (typefaces similares, fundos lisos, etc.). A equipe criou enigmas tentando simular o que o manual reivindicado causaria a OCR mau. Em 2000, Von Ahn e Blum desenvolveram e publicaram a nocao de um CAPTCHA, que incluisse todo o programa que puder distinguir seres humanos dos computadores. Inventaram exemplos multiplos, incluindo o primeiro CAPTCHAs a ser usado extensamente no Yahoo! .

Acessibilidade [ editar | editar codigo-fonte ]

Ver artigo principal: Acessibilidade

CAPTCHAs baseados em leitura de texto ? ou outras tarefas de percepcao visual ? impedem que um usuario cego ou com restricoes na visao acesse o recurso protegido. Cria tambem barreiras para um numero grande de pessoas com as inabilidades de aprendizagem que envolvem a interpretacao de texto. As falhas de projeto em alguns CAPTCHAs impedem mesmo a acessibilidade para usuarios sem qualquer impedimento, por exemplo usando um zero (0) e (o). Para resolver corretamente um CAPTCHA, o usuario e requerido geralmente reconhecer todos os itens do CAPTCHA. Uma falha resulta que o usuario deva responder a um desafio novo.

Por ser projetado para ser ilegivel as maquinas, as ferramentas de assistencia comuns da tecnologia tais como leitores da tela nao podem interpreta-los. Um CAPTCHA visual impede o acesso por usuarios cegos, e pode impedir pessoas daltonicas . Para esta razao, algumas implementacoes permitem aos usuarios optarem por um CAPTCHA de audio. [ 4 ] Mesmo com uma combinacao de desafios do visual e do audio, alguns usuarios serao incapazes de usar um CAPTCHA, por exemplo usuarios surdos.

A escolha de adicionar um CAPTCHA a uma aplicacao e um contrapeso entre a facilidade de utilizacao para usuarios legitimos e criar desafios para abusadores. A inconveniencia causada por um CAPTCHA e as vezes mais elevada para usuarios com inabilidades. Para algumas aplicacoes, o potencial para o abuso e de tal forma elevada que o autor da aplicacao sente que um CAPTCHA e necessario. Para outras aplicacoes, a necessidade de acessibilidade compensa o abuso que impediria.

Tentativas em CAPTCHAs acessivel [ editar | editar codigo-fonte ]

Houve varias tentativas em criar CAPTCHAs mais acessiveis. As tentativas incluem o uso do Javascript , [ 5 ] de perguntas matematicas ("o que e 1+1"), ou "de perguntas do sentido comum" ("que cor e o ceu"). Estas tentativas violam um ou ambos os principios de CAPTCHAs: ou nao podem automaticamente ser gerados ou podem facilmente ser resolvidos dada o estado da inteligencia artificial. Como esta, a unica seguranca fornecida pelo CAPTCHA e seguranca por meio do obscurecimento ; um atacante e improvavel encontrar a formulacao do CAPTCHA na pergunta, e improvavel encontra-la pelos recursos, da despesa e do tempo para quebrar o CAPTCHA mesmo de um site pequeno.

Contornando o CAPTCHA [ editar | editar codigo-fonte ]

Ha algumas aproximacoes em derrotar CAPTCHAs: usando o trabalho humano para reconhece-los, explorando erros na implementacao que permitam ao atacante contornar completamente o CAPTCHA, e finalmente em improvisar um software de reconhecimento de caracteres.

Servos humanos [ editar | editar codigo-fonte ]

CAPTCHA e vulneravel a um ataque que use seres humanos na resolucao dos enigmas. De acordo com uma estimativa, os operadores poderiam facilmente resolver centenas delas cada hora. Se os seres humanos forem empregados dedicados que recebem salario minimo isto nao pode ser considerado viavel, [ 6 ] mas os servicos como o Amazon Mechanical Turk tiveram o sucesso usando pagamento de pequeno vulto para atrair humanos na solucao de outras tarefas. Uma outra variacao desta tecnica envolve copiar as imagens de CAPTCHA e usa-las como CAPTCHAs para um local do elevado-trafego possuido pelo atacante. Com bastante trafego, o atacante pode conseguir uma solucao ao enigma do CAPTCHA. [ 7 ]

Execucao Insegura [ editar | editar codigo-fonte ]

As falhas de projeto em um CAPTCHA podem permitir burlar uma medida de seguranca, ou poderiam tornar um ataque OCR mais facil de montar.

  • Os sistemas de protecao de alguns CAPTCHAs podem ser contorneados sem usar o OCR simplesmente reutilizando a identificacao de uma imagem conhecida do CAPTCHA. Corretamente projetado, um CAPTCHA nao permite tentativas multiplas da solucao. [ 8 ] Isto impede reutilizacao de uma solucao correta ou de fazer uma segunda suposicao depois de uma tentativa incorreta do OCR .
  • Usar um sistema de criptografia muito simples e com poucas combinacoes.
  • Usando somente um pool fixo pequeno de imagens. Eventualmente, quando bastante solucoes de imagem forem coletadas por um atacante sobre um periodo de tempo, o CAPTCHA pode ser quebrado simplesmente olhando acima das solucoes em uma tabela, baseada em uma mistura da imagem do desafio.

Reconhecimento de caracteres pelo computador [ editar | editar codigo-fonte ]

Embora CAPTCHAs visuais sejam projetados originalmente para derrotar o software padrao do OCR projetado para a exploracao do original, um numero de projetos de pesquisa provaram que e possivel derrotar muitos CAPTCHAs com programas que sao ajustados especificamente para um tipo particular. Para CAPTCHAs com letras distorcidas, a aproximacao consiste tipicamente nas seguintes etapas:

  1. Extracao da imagem da Web page.
  2. Remocao da desordem do fundo, por exemplo com filtros da cor e deteccao de linhas finas.
  3. Segmentacao, isto e rachando a imagem nos segmentos que contem uma unica letra.
  4. Identificando a letra para cada segmento.

A maioria dos CAPTCHAs presentes na web trabalham como uma unica linha de imagem. Algumas execucoes racham a imagem nas pecas multiplas ou codificam as partes da imagem no codigo do HTML , forcando um processo automatico para ler e executar o OCR na pagina.

A remocao da desordem e tipicamente muito facil de fazer automaticamente. Em 2005, mostrou-se tambem que os algoritmos da rede neural tem uma taxa de erro mais baixa do que seres humanos na identificacao do glyph. [ 9 ] A unica parte onde os seres humanos ganham ainda dos computadores e segmentacao. Se a desordem do fundo consistir em formas similares, e as letras estiverem conectadas por esta desordem, a segmentacao torna-se quase impossivel com software atual. Conclui-se que um CAPTCHA eficaz deve focalizar na segmentacao.

Reconhecimento de imagens contra o Reconhecimento de textos [ editar | editar codigo-fonte ]

Com a demonstracao (atraves das publicacoes da pesquisa) que alguns CAPTCHAs sao vulneraveis a reconhecedores de caractere e ataques, alguns estudiosos propuseram as alternativas ao reconhecimento de carater, no formulario de reconhecimento CAPTCHA os usuarios identificariam objetos simples nas imagens apresentadas. O argumento e que o reconhecimento do objeto esta considerado tipicamente um problema mais complexo do que o reconhecimento de caractere, devido ao dominio limitado dos caracteres e dos digitos nos alfabetos da maioria de linguas naturais.

Beneficios colaterais [ editar | editar codigo-fonte ]

Alguns dos inventores originais do sistema de CAPTCHA implementaram meios para medir e utilizar o esforco e tempo gasto pelas pessoas que estao respondendo aos desafios de CAPTCHA. Contando trabalho com elementos resolvidos" e "nao resolvidos" incluindo imagens que nao foram reconhecidos com sucesso atraves do OCR em cada desafio. Os mantedores do CAPTCHA estimam que os sistemas existentes de CAPTCHA representam aproximadamente 150.000 horas de trabalho por dia que poderia transparente ser batido atraves da revisao dos sistemas. Isto e aproximadamente 75 anos de trabalho diario realizado.

O ReCAPTCHA, projeto continuado do CAPTCHA utiliza como teste trechos nao reconhecidos por OCRs em livros digitalizados . As respostas dos usuarios, deste modo, serao utilizados na digitalizacao de conteudo para web. [ 10 ] [ 11 ]

Ver tambem [ editar | editar codigo-fonte ]

Referencias

  1. ≪Breaking a Visual CAPTCHA≫ . www.cs.sfu.ca . Consultado em 21 de fevereiro de 2011  
  2. Landim, Wikerson (6 de outubro de 2009). ≪O que e captcha?≫ . O que e captcha? . Consultado em 13 de junho de 2018  
  3. a b ≪The Official CAPTCHA Site≫ . captcha.net . Consultado em 21 de fevereiro de 2011  
  4. O artigo A proposta para um Captcha acessivel descreve como o teste audio e visual pode ser combinado para aumentar a acessibilidade.
  5. ≪Smart Captcha - Protect Web Form .COM≫ . www.protectwebform.com . Consultado em 21 de fevereiro de 2011  
  6. ≪Hire People To Solve CAPTCHA Challenges≫ . Petmail Design . 21 de julho de 2005 . Consultado em 22 de agosto de 2006  
  7. Doctorow, Cory (27 de janeiro de 2004). ≪Solving and creating CAPTCHAs with free porn≫ . Boing Boing . Consultado em 22 de agosto de 2006  
  8. ≪Breaking CAPTCHAs Without Using OCR≫ . Howard Yeend (pureMango.co.uk) . 2005 . Consultado em 22 de agosto de 2006  
  9. Kumar Chellapilla, Kevin Larson, Patrice Simard, Mary Czerwinski (2005). Computers beat Humans at Single Character Recognition in Reading based Human Interaction Proofs (HIPs) (PDF) . [S.l.]: Microsoft Research . Consultado em 2 de agosto de 2006  
  10. ≪Helping everyone, everywhere, one CAPTCHA at a time≫ (em ingles). Google . Consultado em 13 de junho de 2018  
  11. Lotkowski, Micheal (27 de fevereiro de 2017). ≪You are building a self driving AI without even knowing about it≫ . Medium . Consultado em 13 de junho de 2018  

Ligacoes externas [ editar | editar codigo-fonte ]

O Commons possui uma categoria com imagens e outros ficheiros sobre CAPTCHA
Derrotando CAPTCHAs