【问题标题】:How to extract JavaScript link from HTML page in Java?如何从 Java 中的 HTML 页面中提取 JavaScript 链接?
【发布时间】:2012-06-26 13:30:40
【问题描述】:

我有 HTML 页面作为 Java 中的字符串,我需要从中提取 JavaScript 链接。我可以使用任何好的且易于使用的库吗?我查了CobraNeko,但我不认为(也许我错了)他们有我需要的东西,比如获取标签特定的内容。

【问题讨论】:

    标签: java javascript html-parsing hyperlink


    【解决方案1】:

    看看JSoup。它是一个 HTML 解析器,具有用于查找 dom 元素的选择器-DSL(域特定语言)。

    例如,要查找所有带有hrefa 标签,您可以这样做:

    Document doc = Jsoup.connect("http://www.google.com/").get();
    Elements hrefAnchors = doc.select("a[href]"); 
    

    如果您已经将 html 下载为 String,则可以使用 parse(String) 方法:

    String html = "<p>Welcome to <a href='http://www.google.com/'>Google</a>.</p>";
    Document doc = Jsoup.parse(html);
    

    【讨论】:

    • 感谢您的回复。我一定会调查的。但正如我上面所说,我已经将页面解析为字符串。我不需要建立新的连接来获取页面。 'Jsoup' 在这种情况下也能工作吗?
    猜你喜欢
    • 2011-06-04
    • 2013-09-06
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 2012-11-15
    • 2021-11-30
    • 2023-03-30
    • 2019-07-10
    相关资源
    最近更新 更多