【发布时间】:2021-06-19 23:02:44
【问题描述】:
以下代码(特别是正则表达式)可以从一个缩进/制表符转到分号 (;) 的下一个实例:
def find_matches(text):
return capitalize(
[
m
for m in re.findall(
r"^[^0-9]\s+([^.;]+\s*)+[.;]+", normalize("NFKD", text), re.MULTILINE
)
]
)
有了这个,我可以用我的其余代码生成以下图像:
然而,我的问题在于我的正则表达式模式,因为我实际上应该从第一个缩进/制表符到下一个缩进/制表符实例,或者我想直到下一行没有缩进。这是原始的源字符串,它是从使用 docx 的 word 文档中获取的:
Here is a link to a MediaUpload file of my docx. 我选择了链接它,因为我无法在此处正确显示实际格式。此外,第二个文本框应该更长一些。
非常感谢任何帮助。
【问题讨论】:
-
答案成功了吗?