【发布时间】:2018-05-20 17:41:24
【问题描述】:
我注意到如果我使用
请求一个网址urllib.request.urlopen([my_url]).read()
我得到这样的东西:
<html>
<head>
</head>
<body>
<span>...</span>
<body>
<script>
</script>
</html>
我想要的 beautifulsoup 的所有信息都在 <span>...</span> 部分。如果我使用网络驱动程序,则包含该部分。但是 webdriver 似乎需要更长的时间,并且导致我的代码更加混乱。有没有办法在不使用 webdriver 的情况下检索整个 HTML 文档?
【问题讨论】:
标签: python-3.x selenium beautifulsoup webdriver urllib