[Python-de] Python verschluckt sich an chinesischen Schriftzeichen

Thomas 'PointedEars' Lahn PointedEars at web.de
Fr Jun 1 16:01:22 CEST 2012


Bernd Nawothnig wrote:

> On 2012-04-21, wb wrote:
>> Laut sys.maxunicode (= 65535) habe ich wohl auch eine UTF-16 build,
>> was genau das heißen mag...
> 
> Das heißt, dass dann nicht jedes Unicodezeichen intern abgespeichert
> werden kann, also nicht nur nicht dargestellt werden kann.

Wie kommst Du auf dies schmale Brett?  Man kann mit *jeder* Unicode-
Codierung *jedes* Unicode-Zeichen darstellen.  Ob UTF-7, UTF-8, UTF-16 oder 
UTF-32 ist völlig egal.  Die Codierung definiert nur die Länge einer Code-
Einheit (und im Fall von UTF-16BE vs. UTF-16LE die Bytereihenfolge), nicht 
aber die Maximallänge einer Codesequenz und somit auch keinen Maximalwert 
bezüglich des codierbaren Codepunkts.

<http://unicode.org/faq/>

-- 
PointedEars

Please do not Cc: me. / Bitte keine Kopien per E-Mail.


Mehr Informationen über die Mailingliste python-de