Parsear ficheros SGML

luis miguel morillas morillas en posta.unizar.es
Mar Sep 27 23:46:34 CEST 2005


	Asunto: [Python-es] Parsear ficheros SGML
	Fecha: Tue, Sep 27, 2005 at 11:27:07AM +0200


Citando a  Victor Peinado (vitojph en gmail.com):
> ¡Hola a todos!
> 
> Necesito parsear grandes ficheros SGML para extraer información
> etiquetada en determinados campos. ¿Cuál es la mejor forma de hacerlo?
> Me interesaría un método similar al usado con ContentHandler de
> xml.sax.handler pero obviamente menos restrictivo.
> 
> ¿Alguna idea? Gracias de antemano y saludos.
>

Parsear sgml?. Qué buscas exactamente? Para trabajar con xml yo uso 4Suite [1]
y especialmente Amara. Amara es un juguetito que a lo mejor no funciona bien con documentos 
enormes. Pero para ello tendrías que convertir en xml tus documentos sgml. 
Si el documento es muy grande tendrás que usar SAX como sugieres en tu email.



[1] http://4suite.org/index.xhtml
[2] http://uche.ogbuji.net/tech/4suite/amara/
 
> --
> Víctor Peinado || <vitojph /> || http://nlp.uned.es/~victor
> ¡Ningún investigador sin contrato! http://www.precarios-madrid.org
> _______________________________________________
> Python-es mailing list
> Python-es en aditel.org
> http://listas.aditel.org/listinfo/python-es

-- 

Luis Miguel

No a las patentes de software en Europa
EuropeSwPatentFree
http://EuropeSwPatentFree.hispalinux.es




Más información sobre la lista de distribución Python-es