【发布时间】:2016-12-01 23:14:46
【问题描述】:
这是我当前的代码。我不确定我做错了什么。也许我没有深入挖掘 html 并给 Beautifulsoup 正确的标签?目前,我的代码返回空白。
from bs4 import BeautifulSoup
from urllib.request import urlopen
html = urlopen("https://www.youtube.com/watch?v=5_zrHZdhaBU")
soup = BeautifulSoup(html,'html.parser')
nameList = soup.findAll("div", {"id": "cp-2"})
for name in nameList:
print(name.get_text())
这是我检查的代码。我试图让 Python 回到我身边,“但它没有被卷起”
<div id="cp-2" class="caption-line" data-time="7.54"><div class="caption-line-time">0:07</div><div class="caption-line-text">but it was untucked.</div></div>
***编辑
点击分享按钮旁边的“更多”可以找到代码。然后你点击成绩单,你会看到那里的所有文字。
【问题讨论】:
-
我在页面和 html 中找不到这一行。这是什么线?
-
你确定这不是通过 ajax 动态加载的吗?打开页面源,静态源中可能没有这样的元素。
-
@Yevhen Kuzmovych 如果您访问 youtube 页面,在分享旁边有一个“更多”按钮。点击它,然后点击成绩单。现在是 0:07 行。
-
@Andrey Moiseev 也许是?我只是注意到我也没有在开放页面源代码中看到。我刚刚使用谷歌浏览器的检查来找到sn-p。我正在查看可以点击分享按钮旁边的“更多”的成绩单。
-
@BHok 您可能可以找到从中加载脚本的文件。 “资源”或“网络”元素检查器选项卡。
标签: python python-3.x youtube web-scraping beautifulsoup