[Python-es] Modificando un XML

lasizoillo lasizoillo en gmail.com
Jue Abr 21 17:02:22 CEST 2011


El día 21 de abril de 2011 15:16, lopz <lowlifebob en gmail.com> escribió:
>
> El día 20 de abril de 2011 09:37, lasizoillo <lasizoillo en gmail.com> escribió:
>>
>> Recuerdo que cuando usaba BeautifulSoup, antes de por supuesto pasarme
>> a otra librería, tenía la extraña costumbre de leer la documentación:
>> http://www.crummy.com/software/BeautifulSoup/documentation.html#Modifying%20the%20Parse%20Tree
>
>
> Solo por curiosidad ¿cuál usas ahora?
> Es que yo me he quedado con BS y al parecer el lxml va bastante fino.
>

Pues si, uso lxml mayormente. Pero no hay que olvidarse de BS del todo ;-)
http://lxml.de/elementsoup.html

Tener xpath y selectores css puede ahorrar mucho tiempo (de
programador) y lineas de código. Con el iterparse puedes procesar
ficheros xml de varios gigas a una velocidad equivalente o superior a
la que se puede conseguir con un parser sax en java (mucho más coñazo
de hacer y mantener).

Tanto para webscraping, como para procesar ficheros enormes en xml,
lxml no defrauda. La unica desventaja es que hay que compilar cosas en
c, no es pure python.

Saludos:

Javi


Más información sobre la lista de distribución Python-es