【发布时间】:2016-02-18 04:11:15
【问题描述】:
我正在抓取这个维基百科页面:
https://en.wikipedia.org/wiki/List_of_shopping_malls_in_the_South_Florida_metropolitan_area
并从表中获取数据,如下所示:
Location = response.xpath('//*[@id="mw-content-text"]/table/tr/td[2]/a/text()').extract()[0]
Name = response.xpath('//*[@id="mw-content-text"]/table/tr/td[1]/a/text()').extract()
一旦我有了它,计划是将这些列表添加到数据框中。问题是我最后得到的:
len(Name)
40
和
len(Location)
47
这是因为在 location 列的某些行中有几个元素,例如在第三列中:迈阿密椰林 在那里我得到了元素。
【问题讨论】: