【问题标题】:Reverse Engineer a web page对网页进行逆向工程
【发布时间】:2010-05-30 19:20:21
【问题描述】:

我希望将任何网页逆向工程为该页面的逻辑表示。 例如,如果一个网页有一个菜单,那么我想要一个可能是 XML 的逻辑菜单结构。如果网页有文章,我想要一个文章 XML 节点,如果它有文章的标题,我想要一个标题 XML 节点。基本上,我想要没有任何用户界面的网页的逻辑形式。

这个逻辑模型可以是代码中的对象,也可以是 XML 没关系,重要的是它已经确定了页面上所有内容的含义。

【问题讨论】:

    标签: reverse-engineering webpage


    【解决方案1】:

    听起来你想要什么需要人工对页面内容进行分类。

    这可以自动化,但它会出现误报,并且并非在所有情况下都有效。

    例如,如果一个页面使用ul 作为菜单,而另一个页面使用表格单元格怎么办?

    您希望这个网站特别适用于一个网站,还是 Internet 上的任何网站?

    【讨论】:

      【解决方案2】:

      如何解析页面上已有的 XML,请参阅

      http://en.wikipedia.org/wiki/XHTML

      【讨论】:

      • 我也打算建议他将整个互联网转换为 XHTML ;)
      • 让我想找到 Windows 传输对话框的 GIF,上面写着“正在下载 Internet...”
      • @alex - gifbin.com/982378 :) 不过,现在看起来有点小了......
      • 太简单了,需要能够识别页面上的按钮并根据它们的位置知道它们的含义,即用于取消或提交的提交按钮。还有菜单结构、图形上的文字等。
      • @Nick 谢谢...我想我一定是 10 年前第一次看到那个 GIF...
      猜你喜欢
      • 1970-01-01
      • 2016-04-01
      • 1970-01-01
      • 1970-01-01
      • 2011-02-23
      • 2010-09-22
      • 1970-01-01
      • 2011-11-19
      • 2018-08-26
      相关资源
      最近更新 更多