【发布时间】:2013-02-06 04:20:42
【问题描述】:
File input = new File("1727209867.htm");
Document doc = Jsoup.parse(input, "UTF-8","http://www.facebook.com/people/Alison-Vella/1727209867");
我正在尝试解析这个在本地系统中保存和使用的 html 文件。但是解析不会解析所有的html。所以我无法获得我需要的信息。使用此代码解析仅适用于 6k 字符,但实际上 html 文件有 60k 字符。
【问题讨论】:
-
我认为输入没有这么低的限制。我使用更大的输入(在其他星座中)。一定有一些不同的地方出错了
-
你如何确定这个 6k 限制?
-
我检查了 doc(Document doc),它只有 6k 字符并且没有完成
-
很有趣,但我通常使用 eclipse indigo 来编写 java。但我在 Maven 项目的 NetBeans 中尝试了相同的代码。
-
Jsoup 无法处理这个问题,但可以通过解决方法来解决。