[Python-de] HTML mit RegEx filtern
Diez B. Roggisch
deets at web.de
Mi Dez 20 15:25:36 CET 2006
On Wednesday 20 December 2006 14:21, Stefan Antonelli wrote:
> Hallo,
>
> ich würde gerne in Python einen String manipulieren. HTML-Code soll dabei
> bereinigt bzw. umgewandelt werden:
>
> aus <img src='url' alt='irgendwas'> soll <img src='url'> werden. Das lässt
> sich prinzipiell mit dem RegEx Modul machen?
Prinzipiell ja, aber es ist eine schlechte idee. Nimm stattdessen
BeautifulSoup.
Das Problem mit regulaeren Ausdruecken und HTML ist einfach, das sie immer
komplizierter werden und immer mehr Spezialfaelle anhaeufen.
Use the right tool for the job.
Die
Mehr Informationen über die Mailingliste python-de