【问题标题】:How to get the content within ::before and ::after with beautiful soup?如何用漂亮的汤获取 ::before 和 ::after 中的内容?
【发布时间】:2017-10-05 10:11:15
【问题描述】:

我想用以下代码解析一个 html 网站:

<div class="dates">
<div class="clearfix" id="datesDiv"></div>
::before
"some text" <span></span>
"some other text"
::after
</div>

如何用漂亮的汤获得“一些文字”和“一些其他文字”?

使用soup.find 和soup.select 的搜索对我都不起作用。结果总是空的。 当我查看整个站点的 html 代码时,html 代码中也缺少“一些文本”和“一些其他文本”。然而,“一些文本”和“一些其他文本”显示在 html 站点上。 当我用 selenium 和 driver.find_element... 函数搜索它时,它也能正常工作,但这不是我要找的。​​p>

提前致谢!

【问题讨论】:

  • 这是来自您的浏览器调试器吗?
  • Beautifulsoup 无法处理动态内容。对于这些类型的动态内容,您必须使用 selenium。一旦你用 selenium 报废了数据,你就可以使用 bs4 来提取你需要的东西。希望对你有帮助

标签: python css beautifulsoup


【解决方案1】:

动态内容是通过其他来源加载的,通常是 javascript。如果您可以模仿 javascript 发出的请求,那么您可以获得数据。如果您要查找的内容不在页面的源代码中,那么您不能只发出单个请求并使用漂亮的汤来获取它,而无需对实际数据源进行后续请求。

【讨论】:

    猜你喜欢
    • 1970-01-01
    • 2023-04-06
    • 1970-01-01
    • 1970-01-01
    • 2014-11-01
    • 1970-01-01
    • 2019-05-08
    • 1970-01-01
    • 1970-01-01
    相关资源
    最近更新 更多