【发布时间】:2020-01-01 20:58:10
【问题描述】:
所以我试图在 Google 驱动器中获取网络爬取元素。我想要的是文件的修改日期。
而我使用F12查找元素,得到如下选择器
身体> div.ndfHFb-c4YZDc.ndfHFb-c4YZDc-AHmuwe-Hr88gd-OWB6Me.ndfHFb-c4YZDc-vyDMJf-aZ2wEe.ndfHFb-c4YZDc-i5oIFb.ndfHFb-c4YZDc-TSZdd
div.ndfHFb-c4YZDc-MZArnb-b0t70b.ndfHFb-c4YZDc-MZArnb-b0t70b-L6cTce > div.ndfHFb-c4YZDc-MZArnb-bN97Pc.ndfHFb-c4YZDc-s2gQvd > div.ndfHFb-c4YZDc-MZArnb-Tswv1b-nUpftc > div:nth-child(1) > div.ndfHFb-c4YZDc-MZArnb-BKwaUc-bN97Pc > div > div:nth-child(6) > div.ndfHFb-c4YZDc-MZArnb-BKwaUc-V67aGc.ndfHFb-c4YZDc-MZArnb-Tswv1b-V67aGc
为此,我使用 BS4 创建了以下代码。
from bs4 import BeautifulSoup as bs
import requests
req= requests.get ('https://drive.google.com/file/d/12_Lu1VHQI-yjvCPEwUhjonRyGHEczpRc/view')
base= req.text
print(base)
Find_ver=Sr.select('body > div.ndfHFb-c4YZDc.ndfHFb-c4YZDc-AHmuwe-Hr88gd-OWB6Me.ndfHFb-c4YZDc-vyDMJf-aZ2wEe.ndfHFb-c4YZDc-i5oIFb.ndfHFb-c4YZDc-TSZdd > div.ndfHFb-c4YZDc-MZArnb-b0t70b.ndfHFb-c4YZDc-MZArnb-b0t70b-L6cTce > div.ndfHFb-c4YZDc-MZArnb-bN97Pc.ndfHFb-c4YZDc-s2gQvd > div.ndfHFb-c4YZDc-MZArnb-Tswv1b-nUpftc > div:nth-child(1) > div.ndfHFb-c4YZDc-MZArnb-BKwaUc-bN97Pc > div > div:nth-child(6) > div.ndfHFb-c4YZDc-MZArnb-BKwaUc-V67aGc.ndfHFb-c4YZDc-MZArnb-Tswv1b-V67aGc' )
print (Find_ver)
但这一直在打印 [] null dict,有什么帮助吗?
编辑:该链接是可共享的链接。共享链接也需要登录吗?
Edit2:我使用硒解决了这个问题。谢谢大家!
【问题讨论】:
-
google 驱动器隐藏在 bs4 无法通过的登录墙后面。您应该查看谷歌的驱动器 api 以访问此信息
-
@Mikolaj Figurski 关于Api,我正在尝试制作每个人都可以使用的exe,驱动api可以制作那种东西吗?上面的链接是共享链接,每个人都可以在没有登录的情况下访问,这有什么不同吗?
-
@Jun 如果您解决了问题,请发布答案并单击复选标记将问题标记为已解决。
标签: html beautifulsoup python-requests