【发布时间】:2020-08-17 01:58:52
【问题描述】:
嗨,我有一个工作代码,可以完美地打开我告诉他的大多数网站(使用来自 urllib.request 的 urlopen)。 但由于某种原因,这似乎不适用于某些特定网站。我什至没有收到错误,我的代码只是永远运行而没有任何进展。我尝试打开的网站都是https网站,包括那些不起作用的网站。但是我可以手动打开网站,它工作得很好,所以它不像网站关闭或任何东西。任何人都知道为什么会这样吗? 从 urllib.request 导入 urlopen 作为 uReq
url = r'https://www.mouser.de/'
url_text = uReq(url)
html_text = url_text.read()
【问题讨论】:
-
您是否尝试过将用户代理字符串更改为模拟实际浏览器的字符串?输入法,一些网站过滤掉非浏览用户代理。
-
能否贴出代码,并添加不同的网站?
-
对不起,我添加了我的代码。这是我无法访问的网站。如何模拟和实际浏览器?
标签: python web https urllib urlopen