[Python-es] Seleccionar una etiqueta en especial con HTMLParser

lasizoillo lasizoillo en gmail.com
Mar Ago 5 15:47:58 CEST 2014


El día 4 de agosto de 2014, 23:53, Miguel Beltran R.
<yourpadre en gmail.com> escribió:
> No conozco html.parser pero si tu codigo HTML esta bien escribo podrias usar
> lxml y hacer una busqueda con el (cosa que no recuerdo como se hace, pero
> creo que si la tenía)
>

Coincido con la recomendación de lxml.

Puede parsear html
http://lxml.de/parsing.html#parsing-html

Se pueden usar selectores css:
http://lxml.de/cssselect.html
y xpath:
http://lxml.de/xpathxslt.html

Aparte de eso, funciona muy bien con ficheros muy grandes
http://stackoverflow.com/questions/9856163/using-lxml-and-iterparse-to-parse-a-big-1gb-xml-file

Un saludo,

javi

>
> 2014-08-04 15:02 GMT-05:00 Alexandro Colorado <jza en oooes.org>:
>
>> Saludos una pregunta sencilla. Quiero seleccionar una etiqueta por su
>> clase dentro de un html usando html.parser de python 3.2.
>>
>> El html es grande, y aunque he podido parsear cosas como starttag, y
>> data, ahora quiero limitar el html a unicamente las clases que
>> necesito.  En este caso el tag es
>> <td class="ticket">Costo</td>
>> <td class="value">$ 432.23</td>
>>
>> Gracias.
>>
>> --
>> Alexandro Colorado
>> Apache OpenOffice Contributor
>> 882C 4389 3C27 E8DF 41B9  5C4C 1DB7 9D1C 7F4C 2614
>> _______________________________________________
>> Python-es mailing list
>> Python-es en python.org
>> https://mail.python.org/mailman/listinfo/python-es
>> FAQ: http://python-es-faq.wikidot.com/
>
>
>
>
> --
> ________________________________________
> Lo bueno de vivir un dia mas
> es saber que nos queda un dia menos de vida
>
> _______________________________________________
> Python-es mailing list
> Python-es en python.org
> https://mail.python.org/mailman/listinfo/python-es
> FAQ: http://python-es-faq.wikidot.com/
>


Más información sobre la lista de distribución Python-es