【发布时间】:2020-04-04 05:11:53
【问题描述】:
我正在使用 selenium 和 scrapy 实现一个 TikTok 爬虫
start_urls = ['https://www.tiktok.com/trending']
....
def parse(self, response):
options = webdriver.ChromeOptions()
from fake_useragent import UserAgent
ua = UserAgent()
user_agent = ua.random
options.add_argument(f'user-agent={user_agent}')
options.add_argument('window-size=800x841')
driver = webdriver.Chrome(chrome_options=options)
driver.get(response.url)
爬虫会打开 Chrome,但不会加载视频。 Image loading
使用 Firefox 也会出现同样的问题 No loading page using Firefox
使用 Selenium 的简单脚本也存在同样的问题
from selenium import webdriver
import time
driver = webdriver.Firefox()
driver.get("https://www.tiktok.com/trending")
time.sleep(10)
driver.close()
driver = webdriver.Chrome()
driver.get("https://www.tiktok.com/trending")
time.sleep(10)
driver.close()
【问题讨论】:
-
在 Scrapy 外部使用 Selenium 时是否有效?
-
使用 Selenium 的简单 python 脚本问题仍然存在
-
我个人发现zebo的解决方案是可行的
-
你们都说你发现它有效,你能提供你使用的代码的链接吗?
标签: python selenium web-scraping scrapy