【发布时间】:2021-03-18 16:07:31
【问题描述】:
我正在尝试从以下链接导入 5 个产品图片
https://www.zara.com/tr/en/full-length-trousers-p07385169.html?v1=88239943&v2=1471790
当我尝试从以下 Xpath 导入 src 属性时
=IMPORTXML(A1,"//img[@class='media-image__image media__wrapper--media']//@src")
它返回的图像与产品图像不同,尽管它与 chrome 中的检查元素目标中显示的图像不同。
我发现这个类有连续 5 个图像,以逗号分隔
//ul[@class="product-detail-images__images"]/li[5]//source
问题是这个元素包含两个属性,第一个被称为尺寸,当 scraped 时它正常返回它的值,另一个属性将图像链接存储在media srcset 下'当我尝试使用导入它时不返回
=IMPORTXML(A1,"//ul[@class="product-detail-images__images"]/li[5]//source/@media srcset"
甚至
=IMPORTXML(A1,"//ul[@class='product-detail-images__images']/li[5]//source/@*")this 只返回第一个属性!
我的目标是从页面导入所有产品图片。是否有任何我必须对我的导入语句进行修复,或者使用 importxml 导入图像的任何其他方法。
在此深表感谢
【问题讨论】:
-
仅供参考,它是报废而不是报废。报废意味着像垃圾一样扔掉
标签: xpath google-sheets google-sheets-formula