【发布时间】:2017-01-25 04:37:22
【问题描述】:
我正在尝试使用漂亮的汤提取一些信息。我想提取一些位于 html 顶部的信息,一旦它找到一个独特的属性来中断或停止查找并继续下一次迭代。
这是我想要提取的信息的代码。
for mainbody in soup2.find_all('div',class_="thread_body"):
main_body.append([mainbody.get_text().strip()])
我想成为它应该停止在 html 源中查找的点。
<span class="replies">15</span>
有什么想法吗?
谢谢
【问题讨论】:
标签: python breakpoints extraction