[Python-de] korrekte Darstellung der Umlaute

Michael Ströder michael at stroeder.com
Do Apr 5 13:07:55 CEST 2012


Bernd Nawothnig wrote:
> Du beschreibst das Elend des heillosen Mischmaschs zwischen
> Bytesstrings und Unicode in Python 2 ziemlich gut. Genau solche
> Ungereimtheiten waren der Anstoß, das alles in Python 3 sehr viel
> schöner, aber dann eben leider nicht mehr abwärtskompatibel zu lösen.
> Strings sind dort grundsätzlich Unicode, den dann überflüssigen
> Datentyp Unicode gibt es dort folglich nicht mehr.

Was genau ist der prinzipielle Unterschied? Meines Erachtens lediglich, dass
der Default ein anderer ist. Trotzdem muss man das Thema verstanden haben.

Auch in Python 2.x kann/muss man eben '' als Byte-Buffer und u'' als
Zeichenkette von Unicode Character Entities unterscheiden. Letztlich muss man
aber bei irgendeinem I/O die Unicode-Zeichenkette in einen Byte-Buffer mit
geeignetem Encoding konvertieren.

Ciao, Michael.


Mehr Informationen über die Mailingliste python-de