[Python-es] difflib utilizado para páginas web

Eli Bendersky eliben en gmail.com
Vie Ene 7 16:02:06 CET 2011


difflib tiene un "bug" en Python 2.6 y 3.1 (mira el
http://bugs.python.org/issue2986) que puede causar los problemas que tienes.
En Python 2.7 y 3.2 hay un parametro nuevo en difflib.SequenceMatcher que
puede eliminar el "bug".

Eli




2011/1/7 Milton Galo Patricio Inostroza Aguilera <minoztro en gmail.com>

> Estimad en s:
>
> Me han pedido poder notificar a los usuarios de los cambios que sufren
> algunas paginas web de forma periodica (inserción, eliminacion,
> modificación).  Estoy utilizando difflib para hacer esta tarea, pero a
> veces tengo comportamientos errones, es decir, existen veces que
> cuando ciertas columnas se parecen (version antigua v/s nueva)
> simplemente no me marca ningún cambio :-S.
>
> Estoy utilizando de esta manera la librería:
>
>
> diff_texto(codecs.open(antiguo).read().splitlines(),codecs.open(nuevo).read().splitlines())
>
> donde diff_texto es la función que hace el trabajo real:
>
> s = difflib.SequenceMatcher(None, antiguo, nuevo)
>    for e in s.get_opcodes():
>      ...bla...
>
>
> lo extraño es que si utilizo unified_diff o el HtmlDiff si me muestra
> los cambios correctos...alguien se ha topado con este tipo de
> problemas?, saludos!
>
>
>
> --
> Milton
> _______________________________________________
> Python-es mailing list
> Python-es en python.org
> http://mail.python.org/mailman/listinfo/python-es
> FAQ: http://python-es-faq.wikidot.com/
>
------------ próxima parte ------------
Se ha borrado un adjunto en formato HTML...
URL: <http://mail.python.org/pipermail/python-es/attachments/20110107/54292687/attachment.html>


Más información sobre la lista de distribución Python-es