【问题标题】:Extract/ Eliminate duplicate text in imacros提取/消除imacros中的重复文本
【发布时间】:2017-07-06 13:06:17
【问题描述】:

我正在从this 链接中提取数据 通过使用这个

TAG POS=2 TYPE=a ATTR=CLASS:property-sticky-link&&TXT:* EXTRACT=TXT

但这给了我

BHK Apartmentfor sale in1 BHK Apartmentfor sale inKalyan1 BHK Apartment1 BHK Apartmentfor sale in1 BHK Apartmentfor sale inKalyan1 BHK Apartmentfor sale in1 BHK Apartmentfor sale inKalyan1 BHK Apartmentfor sale in1 BHK Apartmentfor sale inKalyan1 BHK Apartment1 BHK Apartmentfor sale in1 BHK Apartmentfor sale inKalyan1 BHK Apartmentfor sale in1 BHK Apartmentfor sale inKalyan1 BHK Apartmentfor sale in1 BHK Apartmentfor sale inKalyan690 sqft

但我想要的只是1 BHK Apartmentfor sale inKalyan 一次

所以尝试了这个SET !VAR1 EVAL("var s=\"{{!EXTRACT}}\"; s.split(' ')[-7];") 还有

SET !VAR1 EVAL("'{{!EXTRACT}}'.match(/?BHK.: (\\d+)/)[-7];")

但这些都不起作用。

关于如何解决这个问题的任何想法。

任何帮助将不胜感激。谢谢

【问题讨论】:

    标签: javascript regex split match imacros


    【解决方案1】:

    我宁愿从单个标签中提取部分:

    TAG XPATH=".//body/descendant::div[@class='propDBlock'][1]/descendant::a[@class='property-sticky-link']/h3" EXTRACT=txt
    

    结果:“1 BHK 公寓”

    TAG XPATH=".//body/descendant::div[@class='propDBlock'][1]/descendant::h3/span[@class='noWrapLocality']" EXTRACT=txt
    

    结果:“待售”

    TAG XPATH=".//body/descendant::div[@class='propDBlock'][1]/descendant::span[@class='localityFirst']" EXTRACT=txt
    

    结果:“Ambernath”

    TAG XPATH=".//body/descendant::div[@class='propDBlock'][1]/descendant::b[@class='areaValue']" EXTRACT=txt
    

    结果:“600 平方英尺”

    ...然后您可以单独使用它们(例如在 csv 文件的不同列中)或通过 javascript 连接它们。

    您也可以在 XPATH 中使用 [{{!LOOP}}] 代替 [number]。

    【讨论】:

      猜你喜欢
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      • 2014-06-13
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      相关资源
      最近更新 更多