【发布时间】:2021-01-24 07:31:54
【问题描述】:
所以我试图抓取 Flipcart.com 纯粹是为了学习,但我遇到了一个问题,不明白为什么。我试图从这个链接中抓取图像 src - https://www.flipkart.com/search?q=sofa & 在我在开发工具中发现 src 是 -
<img class="_396cs4 _3exPp9" alt="Muebles Casa Croma Leatherette 3 Seater Sofa" src="https://rukminim1.flixcart.com/image/612/612/jvtujrk0/sofa-sectional/z/w/h/light-brown-na-colton-letheratte-light-brown-three-seater-sofa-original-imafghzgwdznm33t.jpeg?q=70">
但是当我尝试在 scrapy shell 中抓取它时,我得到了不同 -
In [1]: response.xpath('//div[@class="CXW8mj _21_khk"]/img/@src').get()
Out[1]: '//img1a.flixcart.com/www/linchpin/fk-cp-zion/img/placeholder_fcebae.svg'
谁能告诉我如何解决这个问题,或者为什么 src 会发生变化。
【问题讨论】:
标签: python scrapy scrapy-shell