【发布时间】:2020-09-17 07:14:12
【问题描述】:
我想使用 css 选择器从该 div<div class="one"> 中仅选择文本(在我的示例中为“1.42”)用于抓取目的:
<div class="one">
1.42
<div class="nested">..</div>
</div>
我试过这个但返回整个<div class="one">(我只想要文本):
div.one:first-child
还有这个:
div.one:first-child:not(.nested)
他们都返回文本加上div.nested里面的内容
编辑:
我想通过 Beautifulsoup 使用选择器来抓取特定的文本
soup.select_one('div.one:first-child:not(.nested)')
【问题讨论】:
-
您想对该文本做什么?隐藏它?
-
不能和 Beautifulsoup 一起使用来抓取
-
我看到我在下面的回答没有考虑到您可能无法编辑外部 html 文件,所以如果您能澄清您的 soup.select_one 测试给出的结果是什么有帮助。编辑:你已经写了它是什么,对此感到抱歉。那时我怕是无能为力。 Beautifulsoup 中是否可以使用函数从结果中剥离整个内部 div.nested?
标签: javascript html css web-scraping