【问题标题】:Requests not returning html tags请求不返回 html 标签
【发布时间】:2020-06-10 17:16:00
【问题描述】:

我正在尝试用请求和美味的汤来抓取 YouTube。我需要获得观看次数。它包含在带有 class="watch-view-count" 的 div 标签中,但有时请求对象没有我要查找的标签。如何确保请求对象有我要找的标签。

import requests
from bs4 import BeautifulSoup
markup = requests.get('https://www.youtube.com/watch?v=eSb1_lHcSsg').text
soup = BeautifulSoup(markup.text,'html.parser')
views = soup.findAll('div',{ "class":"watch-view-count"})

有时变量标记不会有任何带有 class=watch-view-count 的 div 标签,而是主要包含 javascript 代码。

【问题讨论】:

  • 请提供您的代码。谢谢。

标签: python-3.x web-scraping beautifulsoup python-requests


【解决方案1】:

尝试pafy 获取观看次数、时长、评分、作者、缩略图、关键字等。

import pafy
url = 'https://www.youtube.com/watch?v=eSb1_lHcSsg'
video = pafy.new(url)
video.viewcount

请确保您pip install youtube_dl

【讨论】:

    猜你喜欢
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 2011-12-11
    • 1970-01-01
    • 1970-01-01
    • 2021-03-09
    • 1970-01-01
    • 1970-01-01
    相关资源
    最近更新 更多