Leyendo HTML mal formado

Francisco Jesús Jordano Jiménez arcturus en us.es
Lun Mar 3 17:28:54 CET 2008


Hola, quizá podrías probar el wrapper para la librería libtidy, 
transforma código html en xhtml,
puedes ver un ejemplo en la página del proyecto:

http://utidylib.berlios.de/

Saludos

Francisco Perez escribió:
> Existe alguna manera de leer (parsear) HTML mal formado? Digamos que
> los generados por MS Word? Hasta ahora use SAX y DOM y con ambos
> obtuve un.."not well-formed (invalid token): line 6, column 17"
>
> Saludos..
> _______________________________________________
> Lista de correo Python-es 
> http://listas.aditel.org/listinfo/python-es
> FAQ: http://listas.aditel.org/faqpyes
>   

_______________________________________________
Lista de correo Python-es 
http://listas.aditel.org/listinfo/python-es
FAQ: http://listas.aditel.org/faqpyes





Más información sobre la lista de distribución Python-es