【问题标题】:Cannot concatenate 'str' and 'NoneType' objects using Scrapy无法使用 Scrapy 连接“str”和“NoneType”对象
【发布时间】:2019-10-06 15:19:54
【问题描述】:

我正在尝试从该网站https://www.gumtree.co.za 抓取信息,但是我不确定如何获取该属性的 URL。

这就是我所拥有的:

class GumtreeSpider(scrapy.Spider):
    name = "gumtree"
    start_urls = ['https://www.gumtree.co.za/s-house-rentals-flat-rentals-offered/cape-town/v1c9071l3100006p1',
                  'https://www.gumtree.co.za/s-houses-flats-for-sale/cape-town/v1c9074l3100006p1']

    def parse(self, response):

        for prop in response.css('div.tileV1'):
            link = 'https://www.gumtree.co.za' + prop.css('div.title  a.tile-title-text::attr(href)').get()

我尝试了多种组合,但似乎无法正确使用。有什么建议么? 谢谢!

【问题讨论】:

标签: python xpath web-scraping scrapy web-crawler


【解决方案1】:

你想在页面中准确地抓取什么?顶部轮播中的广告列表?

如果是,您需要查看 Javascript XHR 请求,它们是动态加载的,因此您必须检查不同的请求以找到您想要的。

【讨论】:

  • 我正在尝试获取实际房产的链接,以检索有关它的其他信息,例如特定的房子,并且我希望能够检索房产的链接(@987654321 @) 这个,作为一个例子。 @纪尧姆
猜你喜欢
  • 1970-01-01
  • 1970-01-01
  • 1970-01-01
  • 1970-01-01
  • 1970-01-01
  • 1970-01-01
  • 1970-01-01
  • 1970-01-01
  • 2021-08-20
相关资源
最近更新 更多