【发布时间】:2021-07-31 08:12:08
【问题描述】:
Ubuntu 20.04
selenium==3.141.0
>>> chromedriver --version
ChromeDriver 92.0.4515.43 (8c61b7e2989f2990d42f859cac71319137787cce-refs/branch-heads/4515@{#306})
>>> chromium-browser --version
Chromium 92.0.4515.107 snap
>>> chromium --version
Chromium 92.0.4515.107 snap
HTML 文件 example.html
<!DOCTYPE html>
<html>
<body>
<h1>My First Heading</h1>
<p>My first paragraph.</p>
</body>
</html>
使用 selenium 驱动渲染 html(传递绝对文件路径)
driver.get('file:///example.html')
在检查 driver.page_source 时只显示它
'<html><head></head><body></body></html>'
为什么它加载一个空页面?
没有具体的回溯错误
注意:相同的代码在 Ubuntu 18 上运行良好
【问题讨论】:
-
您的意思是
h1和p的内容显示不正确? -
是的,即使我尝试了不同的 HTML 文件,什么也看不到
-
你用的是chromium浏览器吗?
-
是的,在无头模式下使用 chromium 浏览器,相同的代码在 ubuntu 18 上运行良好
-
@YaDavMaNish 问题仅适用于本地文件,即使 weburls 工作正常
标签: python selenium web-scraping