【发布时间】:2020-07-31 13:14:18
【问题描述】:
如何获取播放列表 url 的存储方式
这里:https://www.youtube.com/watch?v=VpTRlS7EO6E&list=RDOIhVs0FQ8xc&index=5 用bs4?
使用
from bs4 import BeautifulSoup as bs
import requests
r = requests.get('https://www.youtube.com/watch?v=OIhVs0FQ8xc&list=RDOIhVs0FQ8xc&index=1')
page = r.text
soup=bs(page,'html.parser')
#print(soup)
res=soup.find_all('ytd-playlist-panel-video-renderer')
print(res)
不返回任何内容。即使打印汤本身也不包含我正在寻找的链接(如 href="/watch?v=puNOG62lf-Y&list=RDOIhVs0FQ8xc&index=2")
【问题讨论】:
-
该站点使用 JavaScript 加载,因此您需要使用 selenium 或一些可以处理 JavaScript 的模块。
-
或阅读/了解 youtube-dl(python 项目)如何在不使用 javascript 的情况下提取 youtube 播放列表:github.com/ytdl-org/youtube-dl/blob/master/youtube_dl/extractor/…
-
或使用 pytube,另一个模块。 pytube.io/en/latest/user/quickstart.html
标签: python url beautifulsoup youtube