Araña web en python

David Villa dvilla en gmx.net
Mie Abr 27 21:02:54 CEST 2005



Pero wget y aget tienen todas esas funcionalidades que dices.

- multihilo (aget)
- cambio de rutas (wget --mirror)
- tipos de fichero
- limitación de ancho de banda
y mucho más


¿O la cuestión es tener lo mismo, pero en Python? 

El mié, 27-04-2005 a las 15:01 +0200, Chema Cortes escribió:
> Adrian Ferreres Esteller escribió:
> > Asi que si alguien se le ocurre alguna idea que pueda poner en practica
> > para mejorar la efectividad de mi araña web pues estare muy agradecido
> > si decide compartirla conmigo.
> 
> Hay algo que siempre he echado en falta en una araña: el que pueda bajar
> ficheros en paralelo para acelerar la descarga. Se podría hacer con
> varios multihilos, incorporando algún tipo de limitador de ancho de
> banda para no saturar al servidor.
> 
> Otra opción muy práctica es poder cambiar la dirección "base" de los
> enlaces para que apunten al directorio local donde estás almacenando los
> ficheros, o el que puedas limitar los ficheros a sólo algunas
> extensiones que le digas.
> 
> En fin, la cosa sería imitar un poco la opciones que da el 'wget'.
> _______________________________________________
> Python-es mailing list
> Python-es en aditel.org
> http://listas.aditel.org/listinfo/python-es
> 




Más información sobre la lista de distribución Python-es