【问题标题】:iMacro Exracting with Firefox使用 Firefox 进行 iMacro 提取
【发布时间】:2012-12-27 15:19:22
【问题描述】:

我有一个 iMacro,它可以登录、执行搜索并将“结果”提取到文本文件中。我的挑战是我只得到“结果”的第一页。我想从每一页中提取所有的“结果”。有时只有一页结果,有时可能有 10 页结果。

“结果”页面 1 的格式如下(每个超链接前两个空格): 结果页 1 2 3

“结果”页面 2 的格式如下: 结果页 1 2 3

“结果”页面 3 的格式如下: 结果页 1 2 3

不知道搜索会返回多少页,有第3页怎么才能只提取第三页?

这是宏的一部分:

TAG POS=1 TYPE=INPUT:IMAGE FORM=NAME:form1 ATTR=ID:SEARCH

'=> Extract data of 2nd table (POS=2) on **page 1 **
TAG POS=1 TYPE=A ATTR=TXT:1
TAG POS=2 TYPE=TABLE ATTR=TXT:*location* EXTRACT=TXT

'The SAVEAS statement was added manually to write the extracted table to a file
SAVEAS TYPE=txt FOLDER=* FILE=mytable_{{!NOW:yymmdd_hhnnss}}

'=> Extract data from 2nd table (POS=2) on **page 2**
TAG POS=1 TYPE=A ATTR=TXT:2
TAG POS=2 TYPE=TABLE ATTR=TXT:*location* EXTRACT=TXT
SAVEAS TYPE=txt FOLDER=* FILE=mytable_{{!NOW:yymmdd_hhnnss}}

'=> Extract data from 2nd table (POS=2) on **page 3**
TAG POS=1 TYPE=A ATTR=TXT:3
TAG POS=2 TYPE=TABLE ATTR=TXT:*location* EXTRACT=TXT
SAVEAS TYPE=txt FOLDER=* FILE=mytable_{{!NOW:yymmdd_hhnnss}}

【问题讨论】:

    标签: firefox screen-scraping imacros


    【解决方案1】:

    您可以简单地使用循环参数运行您的脚本,并在其中声明要抓取的页面数,您只需像这样修改它:

    TAG POS=1 TYPE=A ATTR=TXT:{{!loop}}
    TAG POS=2 TYPE=TABLE ATTR=TXT:*location* EXTRACT=TXT
    SAVEAS TYPE=txt FOLDER=* FILE=mytable_{{!NOW:yymmdd_hhnnss}}
    

    【讨论】:

    • 谢谢。我添加了 {{!loop}} 参数并且只设法提取了第一页。有时可能是 1 页,有时可能是 10 页...
    • 您可以通过运行带有循环参数的脚本来控制页面,该脚本在 imacros 侧面板的 Max 文本框中说明要处理的页面数,然后单击播放(循环)按钮
    猜你喜欢
    • 2014-09-13
    • 1970-01-01
    • 1970-01-01
    • 2012-05-20
    • 1970-01-01
    • 1970-01-01
    • 2020-05-18
    • 2019-06-07
    • 2015-12-01
    相关资源
    最近更新 更多