【发布时间】:2011-06-03 12:07:15
【问题描述】:
我需要从如下所示的 HTML 文件中获取一个值(以下示例中的“abc”):
<input type="hidden" name="something" value="abc" />
正如我从其他帖子中发现的那样,我应该使用其中一种 HTML 解析器(不是正则表达式)。您能否告诉我使用哪一个或显示代码示例。
谢谢。
【问题讨论】:
标签: java parsing html-parsing
我需要从如下所示的 HTML 文件中获取一个值(以下示例中的“abc”):
<input type="hidden" name="something" value="abc" />
正如我从其他帖子中发现的那样,我应该使用其中一种 HTML 解析器(不是正则表达式)。您能否告诉我使用哪一个或显示代码示例。
谢谢。
【问题讨论】:
标签: java parsing html-parsing
您可以为此使用Jsoup。
File file = new File("/path/to/file.html");
Document document = Jsoup.parse(file, "UTF-8");
Element something = document.select("input[name=something]").first();
String value = something.val();
System.out.println(value); // abc
// ...
或更短:
String value = Jsoup.parse(new File("/path/to/file.html"), "UTF-8").select("input[name=something]").first().val();
System.out.println(value); // abc
// ...
【讨论】: