【发布时间】:2016-09-06 17:35:25
【问题描述】:
我正在尝试在 python 中解析 pdf 并在引号中提取字符串。我能够提取引用中的文本,但我也想在引用开始之前提取名称。 例如: 考虑一下这个
齐布拉特,丹尼尔。 2004.“重新思考联邦制的起源:来自 19 世纪欧洲的谜题、理论和证据,”
我可以提取所有引用,但我也希望提取名称。 这是我正在使用的代码..请帮助
def quotes(x):
quoted = re.compile('"[^"]*"')
for value in quoted.findall(x):
print value
【问题讨论】: