Re: que==Qué

Gabriel Genellina gagsl-py2 en yahoo.com.ar
Lun Abr 23 19:39:49 CEST 2007


En Mon, 23 Apr 2007 13:47:08 -0300, Antonio Beamud Montero  
<antonio.beamud en linkend.net> escribió:

> El lun, 23-04-2007 a las 13:34 -0300, Gabriel Genellina escribió:
>> def soloascii(uni):
>> ...   assert isinstance(uni, unicode)
>> ...   return unicodedata.normalize("NFKD",
>> uni).encode("ascii","ignore")
>> ...
>
> Pero esto es erroneo, por ejemplo:
>
> moño no es mono (por no poner otro ejemplo :)
> Hay palabras que se pueden "aplanar" pero otras cambian totalmente de
> significado...

Y "qué" no es "que", pero eso es lo que se pedía originalmente.
Supongo que la idea no es comparar palabras al azar, sino encontrar  
valores posiblemente iguales entre fuentes distintas. Especialmente en  
bases de datos un tanto viejas, los textos no siempre fueron ingresados  
con acentos.

Una forma menos drástica es usar xxx.translate(tabla) donde la tabla se  
armó con string.maketrans("áéíóúüÁÉÍÓÚÜ","aeiouuAEIOUU"), esto quitaría  
los acentos usados en castellano nada más, manteniendo cosas como ñ,ç,à,  
etc. sin cambios.

-- 
Gabriel Genellina

------------ próxima parte ------------
_______________________________________________
Python-es mailing list
Python-es en aditel.org
http://listas.aditel.org/listinfo/python-es


Más información sobre la lista de distribución Python-es