[Python-de] Python verschluckt sich an chinesischen Schriftzeichen
Thomas 'PointedEars' Lahn
PointedEars at web.de
Fr Jun 1 16:01:22 CEST 2012
Bernd Nawothnig wrote:
> On 2012-04-21, wb wrote:
>> Laut sys.maxunicode (= 65535) habe ich wohl auch eine UTF-16 build,
>> was genau das heißen mag...
>
> Das heißt, dass dann nicht jedes Unicodezeichen intern abgespeichert
> werden kann, also nicht nur nicht dargestellt werden kann.
Wie kommst Du auf dies schmale Brett? Man kann mit *jeder* Unicode-
Codierung *jedes* Unicode-Zeichen darstellen. Ob UTF-7, UTF-8, UTF-16 oder
UTF-32 ist völlig egal. Die Codierung definiert nur die Länge einer Code-
Einheit (und im Fall von UTF-16BE vs. UTF-16LE die Bytereihenfolge), nicht
aber die Maximallänge einer Codesequenz und somit auch keinen Maximalwert
bezüglich des codierbaren Codepunkts.
<http://unicode.org/faq/>
--
PointedEars
Please do not Cc: me. / Bitte keine Kopien per E-Mail.
Mehr Informationen über die Mailingliste python-de