Que libreria para parsear HTMl me recomendais?

joe di castro enxebree en gmail.com
Lun Feb 23 19:45:22 CET 2009


Hola, 

Para extraer unos datos que necesito para alimentar un programa,
necesito parsear las tablas de una pagina web (que de entrada no tiene
un código HTMl demasiado limpio, ya que está generada con el MS Visual
InterDev) y es la primera vez que me enfrento a esta tarea... el
desconcierto que tengo ahora mismo es la amplia variedad de parsers HTML
que me he encontrado y no demasiado tiempo para analizarlos todos y
decantarme por el más apropiado... en base a vuestra experiencia cual
creéis que seria el más adecuado para empezar a trabajar con él?

Así de entrada he encontrado unas cuantas librerías:

BeautifulSoup, html5lib, lxml, ElementTree, HYMLParser, Genshi,
libxml2... y alguna que se me habrá escapado

Lo que me interesa básicamente es conocer cual seria vuestra elección
para atacar el problema...

Saludos,

Joe

------------ próxima parte ------------
_______________________________________________
Lista de correo Python-es 
http://listas.aditel.org/listinfo/python-es
FAQ: http://listas.aditel.org/faqpyes


Más información sobre la lista de distribución Python-es