Parsear XML o HTML

Luis Miguel Morillas morillas en gmail.com
Mar Mar 25 11:50:59 CET 2008


El 25/03/08, dgonzalez <ikarush en gmail.com> escribió:
> Hola a todos.
>
>  Estube leyendo la documentación oficial de python (tanto en castellano
>  como en inglés) y no me queda claro como parsear HTML.
>
>  Lo que quiero estraer es el contenido de una lista con anclas es decir
>
>  <li><a href="">dato</a></li>
>  <li><a href="">dato</a></li>
>  <li><a href="">dato</a></li>
>  <li><a href="">dato</a></li>
>
>  metiendo todos esos datos en una lista de python.
>
>  ¿Alguien me puede colgar scripts, que realizen algo parecido?.
>
>  A ser posible, me gustaría que fuera utilizando DOM.
>
>  Un saludo y gracias por todo.
>

Con xml usa amara, sin duda. Con html, usa un tagsoup+amara o similar.
Para instalar amara $ sudo easy_install amara
Ejemplos de uso y documentación:  http://wiki.xml3k.org/Amara

Y si tienes dudas, pregunta :-)

-- lm


>
> _______________________________________________
>  Lista de correo Python-es
>  http://listas.aditel.org/listinfo/python-es
>  FAQ: http://listas.aditel.org/faqpyes
>
_______________________________________________
Lista de correo Python-es 
http://listas.aditel.org/listinfo/python-es
FAQ: http://listas.aditel.org/faqpyes





Más información sobre la lista de distribución Python-es