【问题标题】:extracting source code of a webpage提取网页的源代码
【发布时间】:2012-08-02 14:18:07
【问题描述】:

您好,我想提取外部网站(不在我的域中)的源代码,然后对其进行解析以使其成为应用程序。我知道如何使用适用于 JAVA 的 Jsoup 库来做到这一点,但我找不到任何关于如何使用 Javascript 或 Jquery 或任何客户端 Web 编程语言来做到这一点的链接。 有人可以指导我应该使用哪个库。基本上,我想获取网页的 HTML 源代码,然后对其进行解析以提取某些标签下的某些链接。

【问题讨论】:

    标签: javascript html


    【解决方案1】:

    由于same origin policy,您将无法单独使用 JavaScript 执行此操作。这会阻止您从其他域读取信息。

    您需要做的是使用serverside proxy 来获取信息。 Ajax 调用可以调用代理来获取页面。

    【讨论】:

    • 我正在尝试通过创建一个仅从网页加载一些图像的 chrome 扩展来进行实验。所以我不会有服务器!
    猜你喜欢
    • 1970-01-01
    • 1970-01-01
    • 2017-06-04
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    相关资源
    最近更新 更多