Re: eliminar caracteres extraños

Luis Miguel Morillas morillas en gmail.com
Sab Mayo 27 17:11:39 CEST 2006


2006/5/27, camontuyu <camontuyu en yahoo.es>:
> Hola,
> estoy intentando generar un fichero RSS con una serie de datos que cojo
> de diferentes fuentes. El problema está cuando intento validar el
> fichero RSS con Validador W3C me dice que:
>
> line 31, column 530: description contains bad characters (2 occurrences)
> [help]
>
> ... encia, Murrow y su incondicional equipo \x96capitaneado por su
> productor Fr ...
>
> Me coge un carácter extraño \x96.
>
> Quisiera saber si existe alguna forma de parsear la entrada de texto de
> las fuentes para eliminar estos caracteres.
>

Más que un carácter extraño es un problema con el encoding que
utilizas. Tendrás que indicarle al validador que no está usando
unicode (o utf-8) sino iso-8859-1.


Saludos,

--

Luis Miguel




Más información sobre la lista de distribución Python-es