[Python-de] Python verschluckt sich an chinesischen Schriftzeichen

Michael Ströder michael at stroeder.com
Fr Jun 1 21:30:43 CEST 2012


Thomas 'PointedEars' Lahn wrote:
> Michael Ströder wrote:
>> Thomas 'PointedEars' Lahn wrote:
>>> Bernd Nawothnig wrote:
>>>> On 2012-04-21, wb wrote:
>>>>> Laut sys.maxunicode (= 65535) habe ich wohl auch eine UTF-16 build,
>>>>> was genau das heißen mag...
>>
>> Es ist dann ein UCS-2-Build:
>>
>>   --enable-unicode[=ucs[24]]beinahe
>>                           Enable Unicode strings (default is ucs2)
> 
> ACK, das ergibt Sinn.
> 
>>>> Das heißt, dass dann nicht jedes Unicodezeichen intern abgespeichert
>>>> werden kann, also nicht nur nicht dargestellt werden kann.
>>>
>>> Wie kommst Du auf dies schmale Brett?
>>
>> Ist sys.maxunicode nicht die max. Anzahl der Unicode Code Points?
> 
> Es ist "An integer giving the largest supported code point for a Unicode 
> character." [1], was fast auf dasselbe hinausläuft (die max. Anzahl der dann 
> möglichen Codepunkte ist genau 1 mehr, denn U+0000 wird darin 
> eingeschlossen).

Also hatte Bernd durchaus recht mit der Vermutung, dass bei der betreffenden
Python-Installation nicht alle Unicode-Zeichen intern verarbeitet werden
können, auch wenn er sich vielleicht bzgl. Unicode-Begrifflichkeiten
ungeschickt ausgedrückt haben mag.

Ciao, Michael.


Mehr Informationen über die Mailingliste python-de