【问题标题】:How to import an attribute that contains space?如何导入包含空格的属性?
【发布时间】:2021-03-18 16:07:31
【问题描述】:

我正在尝试从以下链接导入 5 个产品图片

https://www.zara.com/tr/en/full-length-trousers-p07385169.html?v1=88239943&v2=1471790

当我尝试从以下 Xpath 导入 src 属性时

=IMPORTXML(A1,"//img[@class='media-image__image media__wrapper--media']//@src")

它返回的图像与产品图像不同,尽管它与 chrome 中的检查元素目标中显示的图像不同。

我发现这个类有连续 5 个图像,以逗号分隔

//ul[@class="product-detail-images__images"]/li[5]//source

问题是这个元素包含两个属性,第一个被称为尺寸,当 scraped 时它正常返回它的值,另一个属性将图像链接存储在media srcset 下'当我尝试使用导入它时不返回 =IMPORTXML(A1,"//ul[@class="product-detail-images__images"]/li[5]//source/@media srcset" 甚至 =IMPORTXML(A1,"//ul[@class='product-detail-images__images']/li[5]//source/@*")this 只返回第一个属性!

我的目标是从页面导入所有产品图片。是否有任何我必须对我的导入语句进行修复,或者使用 importxml 导入图像的任何其他方法。

在此深表感谢

【问题讨论】:

  • 仅供参考,它是报废而不是报废。报废意味着像垃圾一样扔掉

标签: xpath google-sheets google-sheets-formula


【解决方案1】:

经检查,您尝试获取的网站内容似乎受 JavaScript 控制。因此,Google Sheet 无法使用 IMPORT 函数抓取它。

您可以通过将 JavaScript 设置为“阻止”(单击地址栏旁边的锁定图标 -> 网站设置 -> 将 JavaScript 设置为“阻止”)来检查网站是否可以使用 IMPORT 功能抓取,并查看您尝试的内容是否fetch 仍然出现在重新加载的网站上。

请在执行上述步骤后查看网站截图。

【讨论】:

    猜你喜欢
    • 1970-01-01
    • 2011-06-18
    • 2015-02-08
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 2016-10-23
    相关资源
    最近更新 更多