Duda de parser texto o html..

maikeloh en cfg.rimed.cu maikeloh en cfg.rimed.cu
Lun Jun 23 14:27:11 CEST 2008


Hechale un ojo a esto, te parecera interesante lo sencillo y potente que es

http://www.crummy.com/software/BeautifulSoup/

Ignacio Quezada <dreamtrick en gmail.com> escribió:

> Buenas! Tengo un pequeño problema de recursos jeje. Estoy intentando
> conseguir cierta información de una pagina web a travez de python.
> Consigo extraer la pagina en html con:
>
> #!/usr/bin/python
> import urllib, re
>
> # Get something to work with.
> f = urllib.urlopen("http://www.paginaweb.com")
> s = f.read()
> print s
>
> Entonces se que tengo la página en s pero claro, ahora me interesa sacar
> unos datos concretos, no guardar la pagina entera.
> Para ello pensé que lo mejor era usar un htmlparser pero creo que estoy
> en lo erroneo. Entonces, ¿un SimpleParser o algo asi? En cualquiera de
> los casos he intentado buscar información sobre los 2 metodos y he
> encontrado informacion muy muy escasa y nose que hacer.
> Lo que me interesa hacer es algo como esto:
>
> <DIV CLASS=encyc-info-type>
> <STRONG>texto1:</STRONG>
> 	<SPAN>texto2</SPAN>
> </DIV>
>
> Conseguir el "texto2" y guardarlo en una variable "texto1", da igual
> cual sea el nombre en realidad.
>
> ¿Alguna veterano porfavor?, Gracias.
>
>



----------------------------------------------------------------
This message was sent using IMP, the Internet Messaging Program.
_______________________________________________
Lista de correo Python-es 
http://listas.aditel.org/listinfo/python-es
FAQ: http://listas.aditel.org/faqpyes





Más información sobre la lista de distribución Python-es