Duda de parser texto o html..

Javier Santana qualopec en gmail.com
Lun Jun 23 13:21:20 CEST 2008


A lo mejor esto te puede ayudar:
http://www.crummy.com/software/BeautifulSoup/documentation.html

2008/6/23 Ignacio Quezada <dreamtrick en gmail.com>:
> Buenas! Tengo un pequeño problema de recursos jeje. Estoy intentando
> conseguir cierta información de una pagina web a travez de python.
> Consigo extraer la pagina en html con:
>
> #!/usr/bin/python
> import urllib, re
>
> # Get something to work with.
> f = urllib.urlopen("http://www.paginaweb.com")
> s = f.read()
> print s
>
> Entonces se que tengo la página en s pero claro, ahora me interesa sacar
> unos datos concretos, no guardar la pagina entera.
> Para ello pensé que lo mejor era usar un htmlparser pero creo que estoy
> en lo erroneo. Entonces, ¿un SimpleParser o algo asi? En cualquiera de
> los casos he intentado buscar información sobre los 2 metodos y he
> encontrado informacion muy muy escasa y nose que hacer.
> Lo que me interesa hacer es algo como esto:
>
> <DIV CLASS=encyc-info-type>
> <STRONG>texto1:</STRONG>
>        <SPAN>texto2</SPAN>
> </DIV>
>
> Conseguir el "texto2" y guardarlo en una variable "texto1", da igual
> cual sea el nombre en realidad.
>
> ¿Alguna veterano porfavor?, Gracias.
>
>
> _______________________________________________
> Lista de correo Python-es
> http://listas.aditel.org/listinfo/python-es
> FAQ: http://listas.aditel.org/faqpyes
>
_______________________________________________
Lista de correo Python-es 
http://listas.aditel.org/listinfo/python-es
FAQ: http://listas.aditel.org/faqpyes





Más información sobre la lista de distribución Python-es