【发布时间】:2023-04-02 02:20:02
【问题描述】:
在解析 Bitmex 网站时,我注意到使用 bs4 解析的结果与我在 Web 浏览器中实际看到的结果略有不同。当我使用 Devtools 并不断刷新时,我意识到我们正在查看的窗口需要一些时间才能打开,并且 BS4 立即获取 html 并且似乎两个结果之间存在差异。
网站网址是“https://www.bitmex.com/app/trade/XBTUSD”
您只需检查标签<title>...</title>就可以看到区别。
当我使用 bs4 时,他们给了我结果
<title>BitMEX | Bitcoin Mercantile Exchange</title>
但是当我在 Chrome 中看到它们时,它们会给我结果
<title>▼ 6486.0 (XBTUSD) 거래 - BitMEX</title>
像这样。
如何将我在 Chorme 看到的相同代码带到 Python 中?
当然,使用 selenium,我可以将它们带入 Python....但我想知道没有办法使用 bs4 带入它们。
我的编程知识和能力都不好,问题似乎很奇怪。如果您不能理解我的问题,如果您能再问我一次,我将不胜感激。
感谢您阅读。
【问题讨论】:
-
这是一个高度动态的网站——许多功能将由 JavaScript 驱动。 Beautiful Soup 不会运行任何 JavaScript,但您的浏览器(可能)会运行。
-
啊哈..这是动态网站!
标签: python selenium parsing beautifulsoup