[Python-de] open(File) - UTF-8

Matthias Huening mhuening at zedat.fu-berlin.de
Fr Jul 11 13:21:34 CEST 2008


Volker Helm (11.07.2008 09:48):
> 
> Sollte sein
> ...
>         if line[0] == u'@':
> 
> Datei muss auch in UTF8 kodiert sein. Bitte darauf achten.

Ja, nee, das ist es nicht. Das Skript ist schon selber UTF-8:
# -*- coding: utf-8 -*-

Und ob vor das @ als Unicode-Zeichen markiert ist oder nicht, ändert nichts 
an dem seltsamen Verhalten.

Ich habe auch mit Diez' Vorschlag rumgespielt, das codecs-Modul zu 
verwenden. Gibt auch Probleme. Unter WinXP und Python 2.5 liefert dies

codecs.open(dateiname, 'r', 'BOM_UTF8')

einen "LookupError: unknown encoding: BOM_UTF8"

Hhmm.

Matthias





Mehr Informationen über die Mailingliste python-de