[Python-de] Python verschluckt sich an chinesischen Schriftzeichen
Michael Ströder
michael at stroeder.com
Fr Jun 1 21:30:43 CEST 2012
Thomas 'PointedEars' Lahn wrote:
> Michael Ströder wrote:
>> Thomas 'PointedEars' Lahn wrote:
>>> Bernd Nawothnig wrote:
>>>> On 2012-04-21, wb wrote:
>>>>> Laut sys.maxunicode (= 65535) habe ich wohl auch eine UTF-16 build,
>>>>> was genau das heißen mag...
>>
>> Es ist dann ein UCS-2-Build:
>>
>> --enable-unicode[=ucs[24]]beinahe
>> Enable Unicode strings (default is ucs2)
>
> ACK, das ergibt Sinn.
>
>>>> Das heißt, dass dann nicht jedes Unicodezeichen intern abgespeichert
>>>> werden kann, also nicht nur nicht dargestellt werden kann.
>>>
>>> Wie kommst Du auf dies schmale Brett?
>>
>> Ist sys.maxunicode nicht die max. Anzahl der Unicode Code Points?
>
> Es ist "An integer giving the largest supported code point for a Unicode
> character." [1], was fast auf dasselbe hinausläuft (die max. Anzahl der dann
> möglichen Codepunkte ist genau 1 mehr, denn U+0000 wird darin
> eingeschlossen).
Also hatte Bernd durchaus recht mit der Vermutung, dass bei der betreffenden
Python-Installation nicht alle Unicode-Zeichen intern verarbeitet werden
können, auch wenn er sich vielleicht bzgl. Unicode-Begrifflichkeiten
ungeschickt ausgedrückt haben mag.
Ciao, Michael.
Mehr Informationen über die Mailingliste python-de