[Python-de] string split
Sven R. Kunze
srkunze at mail.de
Mi Feb 22 12:07:41 EST 2017
Ich fürchte eine 100%e Lösung gibt's nicht. Aber vielleicht hilft das ja:
last_chars = {word[-1] for word in text.split()}
Damit lässt sich schon mal abschätzen, welche Endungszeichen es gibt.
Wenn du dir dann im Klaren bist, welche du alle akzeptieren möchtest:
Nimm dann dafür re.split https://docs.python.org/2/library/re.html#re.split
re.split('((?\W|\s)+)(?\.|\?|!)', text)
Bin grad auf dem Sprung, aber im Prinzip sollte es so gehen.
vG
Sven
On 22.02.2017 17:49, Frank Grellert wrote:
> Ich habe ein kniffliges Problem zu lösen:
> Ein längerer Text soll in einzelne Sätze aufgespalten werden. Leider
> enden nicht alle Sätze am Zeilenende und darüber hinaus enden auch
> nicht alle mit einem Punkt. Der Text lautet:
>
> text = """Dies ist ein Auszug aus einem langen Text: Welche Zeichen
> befinden sich am Satzende?
> Manchmal ist es ein Ausrufezeichen! Häufig ist es ein Punkt.
> """
> Hat jemand eine Idee?
>
> Danke!
>
> Frank
>
Mehr Informationen über die Mailingliste python-de