Resumen de Python-es, Vol 283, Envío 24
Chema Cortés
py en ch3m4.org
Sab Nov 26 15:30:57 CET 2005
El Viernes, 25 de Noviembre de 2005 23:32, shaggy Eduardo villla escribió:
> Hola a todos lo que quiero validar con expresiones regulares es la
> terminacion de un determinada frase pero antes de que termine, es algo asi
> como una tabla y en cada columna tiene alguna caracteristica, las que
> interesan son el codigo y la descripcion
> es algo asi como:
>
> #start stop Symbol O LinkOut E Cyto Description
> 45077 45940 OR4G3P + sv dl ev mm C 19p13.3 olfactory receptor,
> family 4, subfamily G, member 3 pseudogene
>
> 123813 147098 LOC440499 - sv pr dl ev mm E 19p13.3 similar to
> bA476I15.3 (novel protein similar to septin)
>
> 9957846 9958038 HCP41 - sv dl ev mm C 21p11 cytochrome c, somatic
> pseudogene
>
>
> la idea es que se tiene el codigo y apartir de esta obtemer la descripcion
> de dicho codigo, esto se debe copiar en otro archivo, pero lo que me tiene
> un poco frenado es la expresion.
Parece que lo que quieres es simplemente trocear una línea de texto en campos,
pero falta saber algunas características de esos campos como puede ser el
formato ó si tienen tamaño fijo.
En general, si tienes 11 campos por línea más uno final con la descripción,
podrías hacer lo siguiente:
import re
s=re.compile("\W+")
campos=s.split(linea,11)
codigo=campos[2]
descrip=campos[-1]
--
This message has been scanned for viruses and
dangerous content by MailScanner, and is
believed to be clean.
Más información sobre la lista de distribución Python-es