【问题标题】:How do I go about scraping a url from inline javascript如何从内联 javascript 中抓取 url
【发布时间】:2015-05-20 06:29:46
【问题描述】:

重复 240 次,每次两组最后一位数字是不同的数字,我想要一个所有 url 的列表。

所以我想我需要找到每个脚本,然后在每个脚本中找到第一个“commtArr”,假设它总是第一个。

我什至从哪里开始?

<script type="text/javascript">
            commArr[commArr.length] = "http://example.com/index.php?option==down&pid=123&id=389";
            commtArr[commtArr.length] = "mp3";
            commnArr[commnArr.length] = "john doe.mp3";
</script">

【问题讨论】:

    标签: javascript scrape


    【解决方案1】:

    URL 实际上是插入到 commArr,而不是 commtArr 似乎 commArr 只会有 URL。

    假设脚本在同一个页面上重复 X 次,那么您只剩下一个变量,其中已经包含所有 URL。 这只是一个简单的列出它的案例。

    for (i = 0; i < commArr.length; i++) { console.log(commArr[i]) } 
    

    如果它在不同的页面上,那么您可能需要某种蜘蛛机器人脚本来访问所有页面,运行一个抓取 commArr 的脚本并永久保存它。除了手动操作之外,恐怕我无法为此提出任何建议。

    【讨论】:

      猜你喜欢
      • 1970-01-01
      • 2012-12-11
      • 2020-06-02
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      相关资源
      最近更新 更多