【问题标题】:Finding random youtube videos of a specific language with subtitles查找带有字幕的特定语言的随机 youtube 视频
【发布时间】:2020-04-21 18:39:41
【问题描述】:

我想在 Youtube 上抓取包含字幕/隐藏式字幕 (CC) 的特定语言的视频。

例如,

  1. 我想随机抓取200个英文字幕/(CC)的英文视频。
  2. 我要随机抓取300个带中文字幕的中文视频/(CC)。
  3. 我想随机抓取 550 个带有马来语字幕/(CC) 的马来语视频。

这里有一个api 可以帮助提取文字记录,但现在的主要瓶颈是我必须去 youtube 搜索这些视频并一一观看以了解它们是否确实使用了正确的语言,如果它们真的包含字幕/CC。

【问题讨论】:

    标签: youtube web-crawler google-crawlers


    【解决方案1】:

    一个选项是:

    • 使用YouTube Data API - search 请求搜索包含字幕的视频;为此,请使用带有值的videoCaption 参数:closedCaption

      • 您可能需要使用其他参数来将搜索词减少到特定主题或获得某些所需的结果;例如,对于q 参数,使用检索所需结果的搜索词;还有所有参数,例如:videoDurationtype = 视频、relevanceLanguage
    • 获得此类结果后,复制/粘贴您从请求结果中获得的videoId,并使用您的网络爬虫获取更多视频和相关视频。

    【讨论】:

      【解决方案2】:

      对于仍在为此苦苦挣扎的任何人,并且根据YouTube Data API 以使videoCaption 工作,您还需要将type 参数的值设置为视频:

      如果为此参数指定了值,则还必须设置类型 视频参数的值。

      【讨论】:

        猜你喜欢
        • 2013-03-13
        • 2012-09-23
        • 2015-04-05
        • 1970-01-01
        • 2017-11-21
        • 1970-01-01
        • 2011-01-18
        • 2020-11-12
        • 1970-01-01
        相关资源
        最近更新 更多