【发布时间】:2018-10-17 16:16:04
【问题描述】:
这是我在看了几个教程后第一次使用 Scrapy,我正在尝试抓取这个 url
https://www.hackster.io/arduino/members
我想获取每个用户个人资料的链接。我按如下方式运行我的scrapy shell
print(response.css("#main > div > div > div > div:nth-child(2) > div.hckui__layout__container > div.hckui__layout__wrapper1170 hckui__layout__fullScreenHeight > div > div.common-overlay__parent__1A_nT > div.grid__gridBasic__fjt5B grid__grid__1QeD6 grid__guttersH__2MYvz grid__guttersV__3M28R > div:nth-child(1) > div.undefined hckui__layout__flexCenterItems > div.user_card__content__1YVc5 > a.hckui__typography__bodyM hckui__typography__link hckui__typography__bold::attr(href)").extract())
但我只得到 [] 作为输出
我想获取所附照片中指定的链接,任何人都可以看看并告诉我我的命令是否有问题?
当我使用谷歌的 chorme 检查选项并立即复制选择器时,我得到了相同的输出
#main > div > div > div > div:nth-child(2) > div > div > div > div.common-overlay__parent__1A_nT > div > div:nth-child(1) > div > div > a
or even using
#main > div > div > div > div:nth-child(2) > div > div > div > div.common-overlay__parent__1A_nT > div
【问题讨论】:
标签: python css scrapy screen-scraping