【发布时间】:2020-11-06 07:09:14
【问题描述】:
我想把一个字符串拆分成句子。
但有一些我没想到的例外:
str = "Text... Text. Text! Text? UPPERCASE.UPPERCASE. Name. Text."
想要的分割:
split = ['Text...', 'Text.', 'Text!', 'Text?', 'UPPERCASE.UPPERCASE. Name.', 'Text.']
如何使用正则表达式 python
到目前为止我的努力,
str = "Text... Text. Text! Text? UPPERCASE.UPPERCASE. Name. Text."
split = re.split('(?<=[.|?|!|...])\s', str)
print(split)
我明白了:
['Text...', 'Text.', 'Text!', 'Text?', 'UPPERCASE.UPPERCASE.', 'Name.', 'Text.']
预期:
['UPPERCASE.UPPERCASE. Name.']
[A-Z]+\. Name 中的\s 不拆分
【问题讨论】:
标签: python python-3.x regex regex-lookarounds