existe wget en python???
joana salgado gomez
joana_mendaro en hotmail.com
Mar Nov 21 16:00:33 CET 2006
gracias jose luis. era lo que realmente necesitaba.
______________________________________________________________
From: Jose Luis Dominguez NONLILLY
<DOMINGUEZ_JOSE_LUIS_NONLILLY en LILLY.COM>
Reply-To: La lista de python en castellano <python-es en aditel.org>
To: La lista de python en castellano <python-es en aditel.org>
Subject: Re: [Python-es] existe wget en python???
Date: Tue, 21 Nov 2006 15:36:07 +0100
>Hola, he buscado en el manual de python, y he encontrado el
siguiente
>ejemplo
>
>import urllib2
>opener = urllib2.build_opener()
>opener.addheaders = [('User-agent', 'Mozilla/5.0')]
>opener.open('http://www.example.com/')
>
>lo he probado con google
>f=opener.open('http://www.google.es/seach?q=LO QUE BUSCO')
>t=f.read
>f.close()
>print t
>
>y funciona, ahora solo te quedaría implementar un parser,
>en [1] tienes un ejemplo muy bueno
>
>Espero haberte sido de ayuda.
>
>Un saludo
>Jose
>
>[1]
>http://almacen.gulic.org/diveintopython-5.4-es/html_processing/ext
racting_data.html
>
>
>python-es-bounces en aditel.org wrote on 21/11/2006 15:02:12:
>
> >
> > Justo esto es lo que necesito hacer(bajarme webs que
contnegan una
> > palabra determinada, si no puede ser todo a la vez primero
me bajo la
> > web de la busqueda saco todos los link que tiene parseandola
y luego
> > me bajo las web que realmente me interesan) pero como ya me
lo decia
> > jose luis, google me da problemas que puedo hacer para
solucionarlos.
> >
> > gracias
> >
> > datos={"hl":"es","q":"LO QUE QUIERES BUSCAR"}
> > params = urllib.urlencode(datos)
> > pagina=urlopen("
[1]http://www.google.es/search",params)
> > texto=pagina.read()
> > pagina.close()
> >
> > entre otro codigo html me da este error:
> >
> > Your client does not have permission to get URL
> > <code>/search?hl=es&q=recetas+de+cocina</code> from this
server.
> > (Client IP address: 83.32.158.164)<br><br>
> >
> > Please see Google's Terms of Service posted at
> > http://www.google.com/terms_of_service.html
> >
>
> __________________________________________________________
____
> >
> > From: Jose Luis Dominguez NONLILLY
> > <DOMINGUEZ_JOSE_LUIS_NONLILLY en LILLY.COM>
> > Reply-To: La lista de python en castellano
<python-es en aditel.org>
> > To: La lista de python en castellano
<python-es en aditel.org>
> > Subject: Re: [Python-es] existe wget en python???
> > Date: Mon, 20 Nov 2006 17:22:26 +0100
> > >Vas a tener problemas con el google.
> > >Ya que detecta que python no es un navegador válido
> > >
> > >Aun así la idea general es utilizar la librería urllib
para
> > obtener la
> > >página que quieres
> > >
> > >Para hacer la búsqueda puedes hacer dos cosas
> > >codificar tu cadena como
http://www.google.es/search?hl=es&q=LO
> > QUE QUIERO
> > >BUSCAR
> > >
> > >o utilizar urllib.urlencode()
> > >
> > > datos={"hl":"es","q":"LO QUE QUIERES BUSCAR"}
> > > params = urllib.urlencode(datos)
> > > pagina=urlopen("
http://www.google.es/search",params)
> > > texto=pagina.read()
> > > pagina.close()
> > >
> > >Ahora en texto, (si google no diese problemas) tendrías
el código
> > de la
> > >web que buscas.
> > >
> > >Ahora solo tendrías que analizarla, para ello te creas
una clase
> > derivada
> > >de SGMLParser o de httpParser (este segundo no estoy
seguro de que
> > se
> > >llame así), que la encuentras en la librería sgmllib
> > >
> > > from sgmllib import SGMLParser
> > >y redefines el método handle_starttag
> > >
> > >Hay varios ejemplos en internet. Me parece que httpParser
es más
> > fácil de
> > >manejar, échale un ojo.
> > >
> > >
> > >Aunque yo probaría con la librería que te comentaron
antes, ya que
> > Google
> > >te va a dar problemas
> > >
> > >Un saludo
> > >
> > >python-es-bounces en aditel.org wrote on 20/11/2006
17:02:42:
> > >
> > > >
> > > > ok carlos.
> > > >
> > > > me lo miro. pero me sabrias decir como llegar hasta
esa web
> > de google
> > > > donde estaran todas los links que yo me quiero
bajar, he
> > probado con:
> > > >
> > > > file=urlib.urlopen('[1]http://www.google.com. . .'
)
> > > > pero no se como seguir para que me baje todas las
webs que
> > tengan
> > > > alguna receta de cocina.
> > > >
> > > > GRACIAS
> > >
>
> > ___________________________________________________
_______
> > ____
> > > >
> > > > From: "Carlos Zuniga" <carlos.zun en gmail.com>
> > > > Reply-To: La lista de python en castellano
> > <python-es en aditel.org>
> > > > To: "La lista de python en castellano"
> > <python-es en aditel.org>
> > > > Subject: Re: [Python-es] existe wget en
python???
> > > > Date: Mon, 20 Nov 2006 10:50:59 -0500
> > > > >On 11/20/06, joana salgado gomez
> > <joana_mendaro en hotmail.com>
> > > > wrote:
> > > > >>
> > > > >> muchas gracias arrase por la informacion.
he estado
> > > > probando y
> > > > >> efectivamente se pueden bajr webs siempre y
cuando
> > le´pases
> > > > la
> > > > >> direccion exacta que te quieres bajar pero
sabes si
> > se pueden
> > > > >>bajar
> > > > >> todas las web que contengan una palabra
> > determinada???? es
> > > > >>decir hacer
> > > > >> busquedas desde python, en linux seria algo
asi:
> > > > >>
> > > > >> lynx --dump
> > >
> 'http://www.google.com/search?q=recetas+de+cocina'
> > > > >>
> > > > >>
> > > > >> y se bajaria todas las web que tuvieran
recetas de
> > cocina en
> > > > su
> > > > >> contenido.
> > > > >>
> > > > >>
> > > > >> gracias
> > > > >
> > > > >
> > > > >Si no entiendo mal, lo que quieres es que baje
cada link
> > que sale
> > > > en
> > > > >google no?. Para eso lo que tienes que hacer es
analizar
> > la pagina
> > > > >que
> > > > >bajaste y bajar cada link por separado.
> > > > >
> > > > >Prueba BeautifulSoup para analizarla
> > > > >http://www.crummy.com/software/BeautifulSoup/
> > > > >
> > > > >Saludos
> > > > >--
> > > > >(!c) 2006 - ã«ã«ãã¹
> > > > >Linux Registered User # 386081
> > > > >A menudo unas pocas horas de "Prueba y error"
podrán
> > ahorrarte
> > > > >minutos
> > > > >de leer manuales.
> > > >
> > > > >_______________________________________________
> > > > >Python-es mailing list
> > > > >Python-es en aditel.org
> > > > >http://listas.aditel.org/listinfo/python-es
> > >
>
> > _____________________________________________________
_______
> > _____
> > > >
> > > > Excursiones y escapadas a sitios mágicos. [2]No te
lo
> > pierdas en MSN
> > > > Entretenimiento
> > > >
> > > > References
> > > >
> > > > 1. http://www.google.com/
> > > > 2. http://g.msn.com/8HMAESES/2734??PS=47575
> > > > _______________________________________________
> > > > Python-es mailing list
> > > > Python-es en aditel.org
> > > > http://listas.aditel.org/listinfo/python-es
> > >_______________________________________________
> > >Python-es mailing list
> > >Python-es en aditel.org
> > >http://listas.aditel.org/listinfo/python-es
>
> ____________________________________________________________
_____
> >
> > Busca a la vez en Internet, en directorios, en
enciclopedias...
> > [2]Atrévete con el nuevo MSN Search
> >
> > References
> >
> > 1. javascript:ol('http://www.google.es/search');
> > 2. http://g.msn.com/8HMAESES/2740??PS=47575
> > _______________________________________________
> > Python-es mailing list
> > Python-es en aditel.org
> > http://listas.aditel.org/listinfo/python-es
>_______________________________________________
>Python-es mailing list
>Python-es en aditel.org
>http://listas.aditel.org/listinfo/python-es
_________________________________________________________________
Coches nuevos, coches de ocasión, coches de Km 0 [1]Si piensas en
cambiar de coche, MSN Motor.
References
1. http://g.msn.com/8HMAESES/2746??PS=47575
Más información sobre la lista de distribución Python-es