【发布时间】:2016-03-21 16:20:11
【问题描述】:
我的硬盘上有多个 HTML 文件可以用 Jsoup 解析。 我已经能够解析一个文件,但不能解析多个文件。 我想解析一个文件夹的所有文件。
我编写了这段代码,它从 html 文件(文件夹“C:/html”中名为“file.htm”)中提取文本(在某些 id 内):
package jsouptest;
import java.io.File;
import java.io.IOException;
import org.jsoup.Jsoup;
import org.jsoup.nodes.Document;
import org.jsoup.nodes.Element;
import org.jsoup.select.Elements;
public class Main {
public static void main(String[] args) {
Document doc;
try{
File input = new File("C:/html/file.htm");
doc = Jsoup.parse(input, "UTF-8", "");
Elements ids = doc.select("div[id^=desk] p");
for (Element id : ids){
System.out.println("\n"+id.text());
}
}catch(IOException e){
}
}
}
如何将此代码应用于文件夹“C:/html”中的所有文件? 谢谢
【问题讨论】: