【问题标题】:Getting url automatically from html [closed]从html自动获取url [关闭]
【发布时间】:2013-07-31 03:45:08
【问题描述】:

我必须从网站复制许多网址。为此,我必须单击许多链接,然后我必须将 url(和其他信息)复制到 excel 文件中。这个过程太慢了。我必须为大约 500 个链接这样做。有没有人有一个快速的解决方案来做到这一点?谢谢

【问题讨论】:

  • 这称为web crawler - 您最好咨询 SuperUser 以了解如何在 Excel 中执行此操作。
  • 您是否研究过网站报废?

标签: html url


【解决方案1】:

试试这个。您需要在您拥有的页面上启用 jQuery 和 JavaScript。

您甚至可以从 Firebug 运行此代码!

$(document).ready(function() {
    var hrefs = [], srcs = [];

    $('[href]').each(function() {
        if($(this).attr('href').length) {
            hrefs.push( $(this).attr('href') );
        }
    });

    $('[src]').each(function() {
        if($(this).attr('src').length) {
            srcs.push( $(this).attr('src') );
        }
    });

    if(srcs.length || hrefs.length) {
        document.write('<h1>href\'s</h1><hr />' + hrefs.join("<br />") + '<hr /><hr /><h1>src\'s</h1><hr />' + srcs.join("<br />"));
    } else {
        document.write('No links found on this page.');
    }
});

这些会输出包含hrefsrc 属性的元素的所有链接。

【讨论】:

  • 对不起,我没有解释得这么好。我不必只从一个网页获取网址。我必须从网站内的许多页面获取 url。有一个包含许多链接的主页,在任何链接中都有一些我想复制的网址
  • 所以在你的每一页上运行这段代码。
  • 所以你不认为有一种自动的方法可以做到这一点吗? ...好的,非常感谢,我真的很感激
  • 您可以编写一个服务器端的 URL 爬虫/抓取工具,设置您的 URL,然后让他将这些 URL 存储在文件或数据库表中。对于任何使用 PHP 基础知识过期的人来说,这将是一件容易的事 :)
猜你喜欢
  • 1970-01-01
  • 2011-10-20
  • 1970-01-01
  • 1970-01-01
  • 2010-09-07
  • 2017-05-22
  • 1970-01-01
  • 2018-09-12
  • 2018-11-29
相关资源
最近更新 更多