Duda de parser texto o html..

Jr pillowet en gmail.com
Lun Jun 23 13:21:09 CEST 2008


Puedes usar una expresión regular.. para "capturar" el texto que quieras.
Además veo que ya has hecho el import correspondiente. :P

És solo una opción, yo hace nada tenia una necesidad = y lo hice así.

Saludos.

2008/6/23 Ignacio Quezada <dreamtrick en gmail.com>:

> Buenas! Tengo un pequeño problema de recursos jeje. Estoy intentando
> conseguir cierta información de una pagina web a travez de python.
> Consigo extraer la pagina en html con:
>
> #!/usr/bin/python
> import urllib, re
>
> # Get something to work with.
> f = urllib.urlopen("http://www.paginaweb.com")
> s = f.read()
> print s
>
> Entonces se que tengo la página en s pero claro, ahora me interesa sacar
> unos datos concretos, no guardar la pagina entera.
> Para ello pensé que lo mejor era usar un htmlparser pero creo que estoy
> en lo erroneo. Entonces, ¿un SimpleParser o algo asi? En cualquiera de
> los casos he intentado buscar información sobre los 2 metodos y he
> encontrado informacion muy muy escasa y nose que hacer.
> Lo que me interesa hacer es algo como esto:
>
> <DIV CLASS=encyc-info-type>
> <STRONG>texto1:</STRONG>
>        <SPAN>texto2</SPAN>
> </DIV>
>
> Conseguir el "texto2" y guardarlo en una variable "texto1", da igual
> cual sea el nombre en realidad.
>
> ¿Alguna veterano porfavor?, Gracias.
>
>
> _______________________________________________
> Lista de correo Python-es
> http://listas.aditel.org/listinfo/python-es
> FAQ: http://listas.aditel.org/faqpyes
>



-- 
José R. Pla
_______________________________________________
Lista de correo Python-es 
http://listas.aditel.org/listinfo/python-es
FAQ: http://listas.aditel.org/faqpyes





Más información sobre la lista de distribución Python-es