【发布时间】:2018-10-31 07:14:12
【问题描述】:
我正在抓取一个包含 100MB 大小的大页面的网站。
驱动设置:
chrome_options = Options()
chrome_options.add_argument("--headless")
chrome_options.add_argument("window-size=1920,1080")
chrome_options.add_argument('--no-sandbox')
chrome_options.add_argument('--ignore-certificate-errors')
driver = webdriver.Chrome(executable_path="chromedriver", chrome_options=chrome_options)
以下代码
html = driver.page_source
导致错误:
selenium WebDriverException: Message: unknown error: bad inspector message
(Session info: headless chrome=66.0.3359.181)
(Driver info: chromedriver=2.38.552518 (183d19265345f54ce39cbb94cf81ba5f15905011),platform=Mac OS X 10.11.6 x86_64)
这不可能是我的笔记本电脑上的“内存不足”
【问题讨论】:
-
你见过this吗?你试过其他浏览器吗?
-
您的意思是该网站的页面总大小为 100 MB,还是一个网页大小为 100 MB?您能否提供一个示例来帮助重现该错误?
标签: python selenium google-chrome web-scraping selenium-chromedriver