【问题标题】:how to find correct youtube xpath for python如何为 python 找到正确的 youtube xpath
【发布时间】:2017-11-04 17:32:17
【问题描述】:

我想从 Youtube 上的视频中获取视频标题、视频 ID、视频发布时间、视频观看者等信息。但我不知道如何找到正确的 xpath。以下代码由How to extract the title of a youtube video using python推荐

我尝试使用“Chrome”的检查和“firefox”的萤火虫,但所有这些都不适用于代码(找到的 xpath 是://*[@id="container"]/h1) .结果都是空列表。

import lxml
from lxml import etree

youtube = 
etree.HTML(urllib.request.urlopen("https://www.youtube.com/watch?
v=Tqyu6E_k_cg").read()) 

video_title = youtube.xpath("//span[@id='eow-title']/@title")

print (''.join(video_title))

那么我应该如何找到可以工作的 videoID、观众、postdate 的正确 xpath?

【问题讨论】:

    标签: python xml video xpath youtube


    【解决方案1】:
    video title : //*[@class='watch-title']
    view count : //*[(@class='watch-view-count')]
    upload date: //*[(@class='watch-time-text')]
    

    可以从 URL 中获取视频 ID。

    【讨论】:

    • 非常感谢。因为我没有学过任何关于html或xml的东西,所以我很难找到这些东西。非常感谢。
    【解决方案2】:
    import requests
    page = requests.get("https://www.youtube.com/watch?v=Tqyu6E_k_cg")
    youtube = html.fromstring(page.text)
    
    
    video_title = youtube.xpath("//*[@class='watch-title']/text()")
    video_count = youtube.xpath("//*[(@class='watch-view-count')]/text()")
    video_date = youtube.xpath("//*[(@class='watch-time-text')]/text()")
    

    修改后,这段代码有效!!

    【讨论】:

    • 如果有任何建议,请毫不犹豫地发布。
    猜你喜欢
    • 1970-01-01
    • 1970-01-01
    • 2014-06-21
    • 2022-01-21
    • 2019-11-15
    • 1970-01-01
    • 1970-01-01
    • 2019-12-03
    • 1970-01-01
    相关资源
    最近更新 更多