【发布时间】:2016-07-06 22:03:30
【问题描述】:
我正在抓取链接http://gaana.com/。我想获取编辑器选择专辑的列表,但我无法抓取此链接,不知道我的代码有什么问题。 我的蜘蛛代码:
import scrapy
from tutorial.items import GannaItem
class GannaSpider(scrapy.Spider):
name = 'gannaspider'
start_urls = ["http://www.songspk.link/"]
def parse(self, response):
for sel in response.xpath('/html/body'):
item = GannaItem()
item['Albumname'] = sel.xpath('div[4]/div[4]/div[2]/div[1]/div[5]/div/ul/li[1]/div/div[2]/a[1]/span/text()').extract()
item['link'] = sel.xpath('div[4]/div[4]/div[2]/div[1]/div[3]/div/div[2]/div/ul/li[1]/div/div[2]/a/@href').extract()
yield item
我得到了输出
{'Albumname': [], 'link': []}
【问题讨论】:
标签: python-2.7 scrapy