【发布时间】:2019-08-14 14:37:20
【问题描述】:
我正在尝试在 youtube 上抓取每个 cmets 的点赞数。
我的整体代码循环/向下滚动,但为简单起见,我只显示给我带来问题的部分。我是网络抓取的新手。这是我尝试过的:
page_url="https://www.youtube.com/watch?v=TQG7m1BFeRc"
driver = webdriver.Chrome('C:/Users/Me/Chrome Web
Driver/chromedriver.exe')
driver.get(page_url)
html_source = driver.page_source
html = driver.find_element_by_tag_name('html')
soup=bs(html.text,'html.parser')
soup_source=bs(html_source,'html.parser')
然后我尝试提取喜欢的数量:
for div in soup.find_all('div', class_="style-scope ytd-comment-action-
buttons-renderer"):
a=str(div.text)
print(a)
但这不会返回任何内容。当我检查soup_source 内容时,我可以看到以下我要抓取的信息所在的位置:
<span aria-label="473 likes" class="style-scope ytd-comment-action-
buttons-renderer" hidden="" id="vote-count-left">
473
等
我尝试了一些方法,例如:
html = driver.(By.ID, 'vote-count-left')
但它不起作用。如果有人可以请帮助,将不胜感激。谢谢
【问题讨论】:
标签: python selenium beautifulsoup