无法使用 Scrapy 连接“str”和“NoneType”对象答案

【问题标题】：Cannot concatenate 'str' and 'NoneType' objects using Scrapy无法使用 Scrapy 连接“str”和“NoneType”对象
【发布时间】：2019-10-06 15:19:54
【问题描述】：

我正在尝试从该网站https://www.gumtree.co.za 抓取信息，但是我不确定如何获取该属性的 URL。

这就是我所拥有的：

class GumtreeSpider(scrapy.Spider):
    name = "gumtree"
    start_urls = ['https://www.gumtree.co.za/s-house-rentals-flat-rentals-offered/cape-town/v1c9071l3100006p1',
                  'https://www.gumtree.co.za/s-houses-flats-for-sale/cape-town/v1c9074l3100006p1']

    def parse(self, response):

        for prop in response.css('div.tileV1'):
            link = 'https://www.gumtree.co.za' + prop.css('div.title  a.tile-title-text::attr(href)').get()

我尝试了多种组合，但似乎无法正确使用。有什么建议么？谢谢！

【问题讨论】：

见docs.scrapy.org/en/latest/topics/dynamic-content.html

标签： python xpath web-scraping scrapy web-crawler

【解决方案1】：

你想在页面中准确地抓取什么？顶部轮播中的广告列表？

如果是，您需要查看 Javascript XHR 请求，它们是动态加载的，因此您必须检查不同的请求以找到您想要的。

【讨论】：

我正在尝试获取实际房产的链接，以检索有关它的其他信息，例如特定的房子，并且我希望能够检索房产的链接（@987654321 @) 这个，作为一个例子。 @纪尧姆