Re: Araña web en python
Adrian Ferreres Esteller
raro82 en hotmail.com
Mar Abr 26 09:07:21 CEST 2005
A Mario Renato Uriarte Amaya comentarle que una araña web es,
principalmente, el motor de los buscadores web como AltaVista o Google. Es
un programa recursivo que se lanza a la web, descarga las paginas web en un
disco duro local, extrae los enlaces de dichas páginas y con ellos realiza
nuevas llamadas. La verdad es que es un mundillo interesante . Encontraras
mucha información en internet. Busca por la palabra clave "web crawler".
A Chema Cortes muchisimas gracias por tu ayuda, lo podre en practica para
arreglar mi primitivo prototipo de araña.
A Gari Araolaza también muchisimas gracias por la referencia a la
documentacion. La verdad es que todo esto es para aprender. Es un trabajo de
la universidad en el que me juego el aprobado o el suspenso de una de las 2
ultimas asignaturas que me faltan para acabar la carrera. El profesor ya me
comento que haciendo esto ya tenia el aprobado seguro y que no hacia falta
que me esforzara mas. Sin embargo, aun asi, me duele en el orgullo el saber
que estoy haciendo un programa un poco mediocre. Me gustaria desarrollar
algo de una cierta calidad. Asi que si alguien se le ocurre alguna idea que
pueda poner en practica para mejorar la efectividad de mi araña web pues
estare muy agradecido si decide compartirla conmigo.
Más información sobre la lista de distribución Python-es