【问题标题】:Finding sold out product pages from URL in bulk using importXML使用 importXML 从 URL 中批量查找售罄的产品页面
【发布时间】:2020-07-21 15:08:04
【问题描述】:

我必须从数以万计的 URL 中找出哪些产品已售罄。我的想法是将 URL 放在电子表格中,并在 importXML 显示“已售罄”时获取一个值。示例网址:https://www.conrad.com/p/logitech-usb-headset-h330-909899

示例页面上显示“已售罄”

我的尝试:

=IMPORTXML(A1;"//*[@id='ccpjr']/body/main/section[1]/div/div[1]/div[2]/div[1]/div/div[1]/div/div/span")

('A1' 包含类似'https://www.conrad.com/p/logitech-usb-headset-h330-909899' 的 URL)

我希望它会在单元格中显示:“Sold out”,而是显示:Error: Imported content is empty"

感谢任何帮助,但我必须警告说,不幸的是,我在这方面的知识有限。因此,如果有一个适合我的解决方案,我将更加感激。

【问题讨论】:

    标签: spreadsheet google-sheets-importxml


    【解决方案1】:

    “售罄”在加载后确定。加载后,网站通过调用这个API url来确定库存数量:https://www.conrad.com/restservices/COM/products/pricesAndAvailabilities?net=false&id=909899

    返回的数据是 JSON,所以不能使用ImportXML。相反,将 this script 添加到您的工作表(工具 > 脚本编辑器)。

    然后用这个公式得到库存号。 (它只显示库存数量,而不是“Sold Out”)

    =ImportJSON("https://www.conrad.com/restservices/COM/products/pricesAndAvailabilities?net=false&id=909899","/body/availability/stockQuantity","noHeaders")
    

    请注意,原始 URL 和 API url 的末尾都有相同的 item id,因此您可以使用它来制作所需的 URL。

    【讨论】:

      猜你喜欢
      • 2020-05-19
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      • 2012-09-04
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      相关资源
      最近更新 更多