【发布时间】:2021-05-03 16:45:25
【问题描述】:
我想提取位于 a-tag 元素后面的文本内容。代码如下所示:
<a data-autid="article-url" href="linkToTheWebsite">HERE STANDS THE TEXT I WANT TO EXTRACT</a>
过去这些a-tag元素没有“data-”属性,而是普通的“id”属性,提取起来超级简单。现在我不知道这应该如何工作。我试过这个,但它似乎没有做这项工作:
self.article_title = item.select_one('a', data_autid='article-url').text.strip()
知道我能做什么吗?
【问题讨论】:
标签: python web-scraping beautifulsoup