Resumen de Python-es, Vol 283, Envío 24

Chema Cortés py en ch3m4.org
Sab Nov 26 15:30:57 CET 2005


El Viernes, 25 de Noviembre de 2005 23:32, shaggy Eduardo villla escribió:
> Hola a todos lo que quiero validar con expresiones regulares es la
> terminacion de un determinada frase pero antes de que termine, es algo asi
> como una tabla y en cada columna tiene alguna caracteristica, las que
> interesan son el codigo y la descripcion
> es algo asi como:
>
> #start  	stop    	Symbol	O	LinkOut								E	Cyto	Description
> 45077	45940	OR4G3P	+		sv		dl	ev	mm			C	19p13.3	olfactory receptor,
> family 4, subfamily G, member 3 pseudogene
>
> 123813	147098	LOC440499	-		sv	pr	dl	ev	mm			E	19p13.3	similar to
> bA476I15.3 (novel protein similar to septin)
>
> 9957846	9958038	HCP41	-		sv		dl	ev	mm			C	21p11	cytochrome c, somatic
> pseudogene
>
>
> la idea es que se tiene el codigo y apartir de esta obtemer la descripcion
> de dicho codigo, esto se debe copiar en otro archivo, pero lo que me tiene
> un poco frenado es la expresion.

Parece que lo que quieres es simplemente trocear una línea de texto en campos, 
pero falta saber algunas características de esos campos como puede ser el 
formato ó si tienen tamaño fijo.

En general, si tienes 11 campos por línea más uno final con la descripción, 
podrías hacer lo siguiente:

import re
s=re.compile("\W+")

campos=s.split(linea,11)

codigo=campos[2]
descrip=campos[-1]

-- 
This message has been scanned for viruses and
dangerous content by MailScanner, and is
believed to be clean.




Más información sobre la lista de distribución Python-es