【发布时间】:2020-04-21 18:39:41
【问题描述】:
我想在 Youtube 上抓取包含字幕/隐藏式字幕 (CC) 的特定语言的视频。
例如,
- 我想随机抓取200个英文字幕/(CC)的英文视频。
- 我要随机抓取300个带中文字幕的中文视频/(CC)。
- 我想随机抓取 550 个带有马来语字幕/(CC) 的马来语视频。
这里有一个api 可以帮助提取文字记录,但现在的主要瓶颈是我必须去 youtube 搜索这些视频并一一观看以了解它们是否确实使用了正确的语言,如果它们真的包含字幕/CC。
【问题讨论】:
标签: youtube web-crawler google-crawlers