[Python-es] Busqueda cadenas NO coincidentes

Olemis Lang (Simelix) olemis+py en gmail.com
Mar Mar 23 15:53:54 CET 2010


2010/3/23 Arnau Sanchez <pyarnau en gmail.com>:
> On 23/03/10 14:45, Manuel Enrique González Ramírez wrote:
>
>> Lo que necesito que haga mi programa es:
>> 1. Leer linea a linea archivo1.txt
>> 2. Cada vez que se lea una línea de archivo1.txt busque si esa palabra
>> se encuentra en archivo2.xml
>> 3. Si la palabra NO se encuentra en archivo2.xml se debe crear un
>> archivo nuevo (diferencias.txt) que agregue esa palabra que no encontro
>> en archivo2.xml.  Si el archivo diferencias.tx ya existe entonces que
>> agregue una linea nueva al archivo diferencias.txt con la palabra en
>> cuestion.
>
[...]
>
> Conceptualmente no sé si tiene mucho sentido mirar si una palabra está o no
> en un formato estructurado como XML, pero bueno, supongo que eso ya lo
> tienes controlado.

A priori, mi sugerencia es una de las siguiente (sobre todo si hubiera
algún órden ... ;o) :

  - Generar XML a partir del fichero texto y hacer un diff
     con lxml (al nivel de las etiquetas ;o)
  - Generar texto a partir del fichero XML y hacer un diff
     normal (e.g. udiff ) con difflib

-- 
Regards,

Olemis.

Blog ES: http://simelo-es.blogspot.com/
Blog EN: http://simelo-en.blogspot.com/

Featured article:



Más información sobre la lista de distribución Python-es