[Python-es] Captchas

Rarok rarokillo en gmail.com
Jue Dic 16 20:04:15 CET 2010


El 16 de diciembre de 2010 19:57, Sergio Martín
<sergiomartinj en gmail.com>escribió:

>  Si bueno, han sido creados para ello, pero hay aplicaciones que pueden
> reconocerlos como por ejemplo jDownloader (es un gestor de descargas).
> El caso es que necesito saltármelos y manejar el resultado desde python.
>
>
>
> On jueves 16 de diciembre de 2010 at 19:26, Francesc Alted wrote:
>
> A Thursday 16 December 2010 18:42:33 Sergio Martín escrigué:
>
> ¿Alguien sabe de algún modo para reconocer un catcha?, desde Python o
> desde línea de comandos (por medio de alguna aplicación). La
> cuestión es que el resultado me llegue a Python. Gracias.
>
>
> Pero la idea del captcha no es precisamente que no se pueda reconocer
> por una aplicación? O te entiendo mal?
>
>
Te sería más fácil modificar o sacar código desde el jDownloader, el cual es
actualizado continuamente para poder enfrentarse a los catchas y aún así se
equivoca en montones de ocasiones.

Lo suyo sería primero que utlices librerías de tratamiendo de imágenes para
tratar la imagen y que quede como un texto lo más sencillo posible,
necesitarás hacer ese procedimiento para cada tipo de catcha en concreto.

Luego con la imagen "limpia" tienes que pasarle un OCR para que te convierta
la imagen con texto "fácilmente legible" a una cadena de texto.

Que me conste no hay nada similar creado en python, y tampoco es fácil,
jDownloader tiene MUCHOS colaboradores trabajando sobre el mismo porque cada
página web utiliza un tipo de catcha distinto y hay que hacer unos
algoritmos para tratar las imágenes distintos para cada uno, y aún así
generan errores a montones.

Piénsalo, si con un programa cualquier se pudiesen saltar no habría
industria de gente que cobra por resolver catchas a mano.
------------ próxima parte ------------
Se ha borrado un adjunto en formato HTML...
URL: <http://mail.python.org/pipermail/python-es/attachments/20101216/7c260865/attachment.html>


Más información sobre la lista de distribución Python-es