Re: Araña web en python

Adrian Ferreres Esteller raro82 en hotmail.com
Mar Abr 26 09:07:21 CEST 2005


A Mario Renato Uriarte Amaya comentarle que una araña web es, 
principalmente, el motor de los buscadores web como AltaVista o Google. Es 
un programa recursivo que se lanza a la web, descarga las paginas web en un 
disco duro local, extrae los enlaces de dichas páginas y con ellos realiza 
nuevas llamadas. La verdad es que es un mundillo interesante . Encontraras 
mucha información en internet. Busca por la palabra clave "web crawler".

A Chema Cortes muchisimas gracias por tu ayuda, lo podre en practica para 
arreglar mi primitivo prototipo de araña.

A Gari Araolaza también muchisimas gracias por la referencia a la 
documentacion. La verdad es que todo esto es para aprender. Es un trabajo de 
la universidad en el que me juego el aprobado o el suspenso de una de las 2 
ultimas asignaturas que me faltan para acabar la carrera. El profesor ya me 
comento que haciendo esto ya tenia el aprobado seguro y que no hacia falta 
que me esforzara mas. Sin embargo, aun asi, me duele en el orgullo el saber 
que estoy haciendo un programa un poco mediocre. Me gustaria desarrollar 
algo de una cierta calidad. Asi que si alguien se le ocurre alguna idea que 
pueda poner en practica para mejorar la efectividad de mi araña web pues 
estare muy agradecido si decide compartirla conmigo.




Más información sobre la lista de distribución Python-es