【问题标题】:How to break a loop in bs4如何打破bs4中的循环
【发布时间】:2017-01-25 04:37:22
【问题描述】:

我正在尝试使用漂亮的汤提取一些信息。我想提取一些位于 html 顶部的信息,一旦它找到一个独特的属性来中断或停止查找并继续下一次迭代。

这是我想要提取的信息的代码。

for mainbody in soup2.find_all('div',class_="thread_body"):
    main_body.append([mainbody.get_text().strip()])

我想成为它应该停止在 html 源中查找的点。

<span class="replies">15</span>

有什么想法吗?

谢谢

【问题讨论】:

    标签: python breakpoints extraction


    【解决方案1】:

    您需要在脚本中使用if 语句并使用breakbreak 将停止正在运行的最里面的循环。我不知道你真正想做什么,所以我建议一些可能适用于你的情况:

    for mainbody in soup2.find_all('div',class_="thread_body"):
        a = mainbody.get_text().strip()
        if a == '15':
            main_body.append(a)
            # get out from this for loop
            break
    

    【讨论】:

      猜你喜欢
      • 1970-01-01
      • 2013-01-30
      • 2015-10-04
      • 2013-08-31
      • 1970-01-01
      • 1970-01-01
      • 2022-12-15
      • 1970-01-01
      相关资源
      最近更新 更多