[python-nl] unicode barf

Armijn Hemel armijn at uulug.nl
Thu Dec 21 17:12:14 CET 2006


beste Pythonettes,


het volgende is iets waarvan ik vrees dat het een beginnersiets is, maar
ik zit al de hele middag m'n hoofd erop te breken.

Met PyExpat (uit xml.dom.ext.reader) trek ik een XML bestand uit elkaar,
met XPath. De resultaten hiervan bevatten karakters die niet in de standaard
ASCII karakterset zitten en waarvoor je allemaal extra toetsen nodig hebt,
die niet op mijn oude SGI toetsenbord met US layout zitten ;-)

In ieder geval, ik wil die strings graag netjes geescapet hebben (het moet
namelijk een MySQL databeest in), maar MySQLdb.escape_string() vindt dat niet
echt lief:

UnicodeEncodeError: 'ascii' codec can't encode character u'\xb2' in position 101: ordinal not in range(128)

(Ja, logisch dat dat karakter niet in de ASCII tabel zit. Duh.)

Heel Google staat er vol mee, maar ik ben er nog niet achter waar het
probleem zit. Is dat PyExpat (0.8.4), die ik moet vertellen dat wat in de
XML staat toch echt rare karakters heeft en geen ASCII is, of zit het
compleet ergens anders?

Op dit moment zit ik behoorlijk met m'n handen in het weinige haar dat ik
nog heb en ik hoop dan ook dat jullie me kunnen helpen.

armijn

-- 
 ---------------------------------------------------------------------------
  armijn at uulug.nl | http://www.uulug.nl/ | UULug: Utrecht Linux Users Group
 ---------------------------------------------------------------------------


More information about the Python-nl mailing list