【问题标题】:How to extract src element in a web page in python如何在python中提取网页中的src元素
【发布时间】:2020-07-12 15:15:39
【问题描述】:

我需要从“https://www.gizbot.com/mobile-brands-in-india/”中提取图像 src 以及品牌名称。 我试过用scrapy- 蜘蛛.py

    def parse(self, response):
        page = response.url.split("/")[-2]
        filename = 'mobiles-%s.html' % page
        mob = response.xpath('.//div[has-class("all-brands-block-desc-brand")]/text()').getall()
       
        for mobile in mob:
            m = str(mobile).split()[0]
            with open(filename, 'a') as f:
                f.write("%s %s\n" % (mobile, response.xpath('.//a[contains(@href, m)]').xpath("@href").extract()))
            self.log('Saved file %s' % filename)

但它没有提取正确的数据。我不知道我哪里出错了。感谢任何帮助。

【问题讨论】:

  • 用于提取图像 src。对于我在 response.css('div.all-brands-block'): print("gizbot.com" + i.css('img::attr("data-pagespeed-lazy-src")').get ())

标签: python-3.x web-scraping scrapy


【解决方案1】:

您需要使用以下 xpath:

mob = response.xpath('//div[contains(@class, "all-brands-block-desc-brand")]').getall()

【讨论】:

  • xpath* 你打错了。
猜你喜欢
  • 2017-07-21
  • 1970-01-01
  • 2022-01-25
  • 1970-01-01
  • 1970-01-01
  • 2021-09-07
  • 1970-01-01
  • 2021-07-16
  • 2022-01-19
相关资源
最近更新 更多