【问题标题】:Python Newspaper subheadingPython 报纸副标题
【发布时间】:2018-08-14 04:44:34
【问题描述】:

我想提取这篇文章和其他文章的 SUBHEADING: https://www.dr.dk/nyheder/regionale/trekanten/legos-regnskab-viser-tilbagegang

即:“Lego har netop præsenteret regnskabet for 2017, og kurven peger nedad。”

然而,python 模块 Newspaper 似乎不能做到这一点。

我错过了什么吗? 还有其他模块可以吗?我也尝试过可读性和 html2text。

我的代码:

from newspaper import Article

url = 'https://www.dr.dk/nyheder/regionale/trekanten/legos-regnskab-viser-tilbagegang'
article = Article(url)

article.download()
article.parse()

print (article.title)
print (article.text)

【问题讨论】:

    标签: python python-newspaper


    【解决方案1】:

    我认为你应该使用:

    print(article.meta_description)
    

    这将打印文章的副标题。

    【讨论】:

    • 这会从 中的元标记中获取副标题,而不是在文章文本中。问题是其他报纸没有在这里显示他们的副标题。外汇。 politiken.dk/indland/art6367735/…
    猜你喜欢
    • 1970-01-01
    • 2012-06-07
    • 2020-07-27
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    相关资源
    最近更新 更多