Construir un bot para analizar una pagina web

Cesar Cardenas Desales cescd en yahoo.com.mx
Lun Oct 16 18:38:02 CEST 2006


Prueba con Twill, esta en una capa de abstraccion
superior que los modulos comunes de la libreria
estandar:

http://twill.idyll.org/

 --- Jose Luis Dominguez NONLILLY
<DOMINGUEZ_JOSE_LUIS_NONLILLY en LILLY.COM> escribió:

> Hola a todos.
> 
> Tengo idea de hacer un bot, que se registre en una
> determinada página web, 
> y extraiga ciertos datos, y siga navegando por dicha
> web.
> 
> Para aclararlo más. Quiero automatizar la extracción
> de datos de la típica 
> base de datos de una web, que muestra los registros
> de 10 en 10.
> 
> Hasta ahora lo estoy haciendo a mano con el típico
> copy-paste.
> 
> 
> Mi pregunta es: que librerías se utilizan para esto.
> 
> He googleado por internet, y he encontrado urllib y
> urllib2, con la que 
> soy capaz de abrir una determinada página.
> 
> Existe alguna librería que me ayude a parsear, he
> estado viendo htmllib, 
> pero no parece muy potente.
> 
> Necesitaría algo que me ayudase a identificar los
> objetos, para luego 
> almacenarlos en una base de datos, o un fichero
> local.
> 
> Un saludo a todos y gracias por adelantado
> _______________________________________________
> Python-es mailing list
> Python-es en aditel.org
> http://listas.aditel.org/listinfo/python-es
> 



	
	
		
___________________________________________________________ 
Do You Yahoo!? 
La mejor conexión a Internet y <b >2GB</b> extra a tu correo por $100 al mes. http://net.yahoo.com.mx 




Más información sobre la lista de distribución Python-es