【问题标题】:imacros downloading the url addressimagros 下载 url 地址
【发布时间】:2016-02-24 23:41:23
【问题描述】:

我正在尝试记录,当我点击一个站点时,我想捕获我登陆的每个 url 地址。有没有办法做到这一点? 这是我的宏的示例:

版本构建=8021970 制表符 T=1 选项卡关闭所有其他人 网址转到=https://www.meritorpartsonline.com/webapp/wcs/stores/servlet/CategoryDisplay?urlRequestType=Base&catalogId=10051&categoryId=10001&pageView=detailed&urlLangId=-1&beginIndex=0&langId=-1&top_category=10001&top=Y&parent_category_rn=10001&storeId=10154 TAG POS=1 TYPE=A FORM=ID:displayForm ATTR=ID:WC_CategoriesSidebarDisplayf_links_2_1 TAG POS=1 TYPE=A FORM=ID:displayForm ATTR=ID:WC_CategoriesSidebarDisplayf_links_2_1 标签 POS=4 TYPE=IMG ATTR=SRC:https://www.meritorpartsonline.com/wcsstore/MeritorStorefrontAssetStore/images/* 标签 POS=4 TYPE=IMG ATTR=SRC:https://www.meritorpartsonline.com/wcsstore/MeritorStorefrontAssetStore/images/* 标签 POS=4 TYPE=IMG ATTR=SRC:https://www.meritorpartsonline.com/wcsstore/MeritorStorefrontAssetStore/images/* 标签 POS=4 TYPE=IMG ATTR=SRC:https://www.meritorpartsonline.com/wcsstore/MeritorStorefrontAssetStore/images/* 标签 POS=4 TYPE=IMG ATTR=SRC:https://www.meritorpartsonline.com/wcsstore/MeritorStorefrontAssetStore/images/* 标签 POS=4 TYPE=IMG ATTR=SRC:https://www.meritorpartsonline.com/wcsstore/MeritorStorefrontAssetStore/images/* TAG POS=1 TYPE=A FORM=ID:displayForm ATTR=ID:WC_CategoriesSidebarDisplayf_links_2_1 TAG POS=1 TYPE=A ATTR=ID:WC_BreadCrumbTrailDisplay_link_4 TAG POS=1 TYPE=A FORM=ID:displayForm ATTR=ID:WC_CategoriesSidebarDisplayf_links_2_2 标签 POS=4 TYPE=IMG ATTR=SRC:https://www.meritorpartsonline.com/wcsstore/MeritorStorefrontAssetStore/images/* 标签 POS=4 TYPE=IMG ATTR=SRC:https://www.meritorpartsonline.com/wcsstore/MeritorStorefrontAssetStore/images/* 标签 POS=4 TYPE=IMG ATTR=SRC:https://www.meritorpartsonline.com/wcsstore/MeritorStorefrontAssetStore/images/* 标签 POS=4 TYPE=IMG ATTR=SRC:https://www.meritorpartsonline.com/wcsstore/MeritorStorefrontAssetStore/images/* 标签 POS=4 TYPE=IMG ATTR=SRC:https://www.meritorpartsonline.com/wcsstore/MeritorStorefrontAssetStore/images/* 标签 POS=4 TYPE=IMG ATTR=SRC:https://www.meritorpartsonline.com/wcsstore/MeritorStorefrontAssetStore/images/* TAG POS=4 TYPE=IMG ATTR=SRC:https://www.meritorpartsonline.com/wcsstore/MeritorStorefrontAssetStore/images/*

【问题讨论】:

    标签: imacros


    【解决方案1】:

    播放下面的宏并上网。它会将您访问的每个 url 写入“dnlUrls.txt”文件中。 (当你想完成跟踪时停止这个宏。)

    SET !LOOP -9999999
    SET urlFolder EVAL("('{{urlAddress}}' != '{{!URLCURRENT}}') ? '*' : 'noSuchFolder';")
    SET urlAddress EVAL("('{{urlAddress}}' != '{{!URLCURRENT}}') ? '{{!URLCURRENT}}' : '{{urlAddress}}';")
    SET !EXTRACT {{urlAddress}}
    
    SET !ERRORIGNORE YES
    SAVEAS TYPE=EXTRACT FOLDER={{urlFolder}} FILE=dnlUrls.txt
    SET !ERRORIGNORE NO
    WAIT SECONDS=1
    

    【讨论】:

    • 感谢您的回复。我有点困惑,所以我道歉......所以我编辑了我当前的宏并添加了你的宏,当我点击播放时,我得到了一个关于负循环的错误 - 当我把它设为正时它确实有效。但我想我的问题是当你说播放时我应该录音吗?我的页面会落在第 4 行和第 6 行之间吗?再次感谢
    • 我没有写到我的宏必须与你的结合。现在我真的不明白您要保存的网址是什么。我建议尽量减少上面的代码并澄清问题,以便让我和其他帮助者明白这一点。
    • 很抱歉。您的宏有效 - 它仅完美捕获我所在的当前页面。但是,我有大约 100 个页面可以访问,我想像在您的宏中那样捕获每个 url。所以我假设我需要在宏中的某处记录页面,以便它知道要捕获什么。我要去的网站有 100 页的第 1 页,我想单击每个页面捕获 url,单击下一页,捕获 url...我通常会为此使用 Python,但该网站太复杂了。谢谢,如果这太令人困惑,我再次道歉 - 我不知道如何描述它。
    • 你的问题太宽泛了,简单(但可能没用)的答案是在你的宏中每次点击(或URL GOTO)后写2个字符串:SET !EXTRACT {{!URLCURRENT}}SAVEAS TYPE=EXTRACT FOLDER=* FILE=dnlUrls.txt并使用循环浏览从 txt 文件中获取的页面。如果这种自动化不适合您的问题,您应该使用“iMacros”的脚本接口之一。 (尽管如此,如果您已经拥有与这 100 个页面类似的 URL 地址列表,我仍然不明白为什么您需要一个 url 地址列表。)
    猜你喜欢
    • 1970-01-01
    • 1970-01-01
    • 2016-12-22
    • 2012-12-25
    • 2016-05-12
    • 2020-09-01
    • 2013-09-20
    • 1970-01-01
    • 1970-01-01
    相关资源
    最近更新 更多