【问题标题】:Extract table from html using Java or Javascript使用 Java 或 Javascript 从 html 中提取表格
【发布时间】:2013-07-29 05:20:47
【问题描述】:

我有一个名为page1.html、page2.html 的html 文件。在 page1.html 和 page2.html 中,我在表格元素中有一些内容,现在我想提取这些表格内容并将其放入名为 summary.html 的新文件中。我不知道 jQuery,所以如何从 Java 或 Javascript 做到这一点。我知道如何从 Java/Javascript 创建 html。

【问题讨论】:

  • 你不能真的说你不知道 jQuery 但正在寻找 JavaScript 的解决方案,不是吗? ;)
  • 我很确定 op 正在混淆 java 和 javascript

标签: javascript java html-table html-content-extraction


【解决方案1】:

如果使用 Java,我能想到的最佳选择是使用 JSOUP,一个 Java HTML 解析器库。

File input = new File("C:\\page1.html");
Document doc = Jsoup.parse(input, "UTF-8");

Element table = doc.getElementByTag("table");
Elements rows = table.getElementsByTag("tr");
for (Element row : rows) {
  String rowText = row.text();
}

【讨论】:

  • 谢谢。我怎样才能得到特定的表说表与 id 或类?
  • 代码无法编译。
猜你喜欢
  • 2014-07-25
  • 1970-01-01
  • 1970-01-01
  • 1970-01-01
  • 2012-03-28
  • 1970-01-01
  • 2020-06-30
  • 2018-05-11
  • 2013-10-23
相关资源
最近更新 更多