from newspaper import Article

url = '你想要爬取的网站url' news = Article(url, language='zh')
news .download() #先下载 news .parse() #再解析
print(news.text) #新闻正文 print(news.title) #新闻标题 print(news.html) #未修改的原始HTML print(news.authors) #新闻作者 print(news.top_image) #本文的“最佳图像”的URL print(news.movies) #本文电影url print(news.keywords) #新闻关键词 print(news.summary) #从文章主体txt中生成的摘要
print(news.images) #本文中的所有图像url

相关文章:

  • 2021-02-12
  • 2022-12-23
  • 2021-08-06
  • 2021-08-25
  • 2021-12-20
  • 2021-12-30
  • 2021-08-25
  • 2022-01-26
猜你喜欢
  • 2022-12-23
  • 2022-12-23
  • 2021-11-14
  • 2021-10-08
  • 2022-12-23
  • 2021-09-15
相关资源
相似解决方案