【问题标题】:Extracting string before the quotations在引号之前提取字符串
【发布时间】:2016-09-06 17:35:25
【问题描述】:

我正在尝试在 python 中解析 pdf 并在引号中提取字符串。我能够提取引用中的文本,但我也想在引用开始之前提取名称。 例如: 考虑一下这个

齐布拉特,丹尼尔。 2004.“重新思考联邦制的起源:来自 19 世纪欧洲的谜题、理论和证据,”

我可以提取所有引用,但我也希望提取名称。 这是我正在使用的代码..请帮助

def quotes(x):
    quoted = re.compile('"[^"]*"')
    for value in quoted.findall(x):
        print value 

【问题讨论】:

    标签: python extract quotes


    【解决方案1】:

    在双引号之前捕获数据应该可以工作:

    def quotes(x):
        quoted = re.compile('(.+)"[^"]+"')
        for value in quoted.findall(x):
            print value.strip()
    

    我得到这个输出:

    >>> quotes(text)
    'Ziblatt, Daniel. 2004.'
    

    【讨论】:

      猜你喜欢
      • 2011-01-05
      • 1970-01-01
      • 1970-01-01
      • 2018-08-21
      • 1970-01-01
      • 1970-01-01
      • 2021-09-19
      • 1970-01-01
      相关资源
      最近更新 更多