Re: eliminar caracteres extraños
Luis Miguel Morillas
morillas en gmail.com
Sab Mayo 27 17:11:39 CEST 2006
2006/5/27, camontuyu <camontuyu en yahoo.es>:
> Hola,
> estoy intentando generar un fichero RSS con una serie de datos que cojo
> de diferentes fuentes. El problema está cuando intento validar el
> fichero RSS con Validador W3C me dice que:
>
> line 31, column 530: description contains bad characters (2 occurrences)
> [help]
>
> ... encia, Murrow y su incondicional equipo \x96capitaneado por su
> productor Fr ...
>
> Me coge un carácter extraño \x96.
>
> Quisiera saber si existe alguna forma de parsear la entrada de texto de
> las fuentes para eliminar estos caracteres.
>
Más que un carácter extraño es un problema con el encoding que
utilizas. Tendrás que indicarle al validador que no está usando
unicode (o utf-8) sino iso-8859-1.
Saludos,
--
Luis Miguel
Más información sobre la lista de distribución Python-es