【发布时间】:2011-03-10 20:32:19
【问题描述】:
我正在使用一个名为 Jsoup 的 HTML 解析器来加载和解析 HTML 文件。问题是我正在抓取的网页是用ISO-8859-1 字符集编码的,而Android 使用的是UTF-8 编码(?)。这会导致某些字符显示为问号。
所以现在我想我应该将字符串转换为 UTF-8 格式。
现在我在 Android SDK 中找到了这个名为 CharsetEncoder 的类,我想这对我有帮助。但是我不知道如何在实践中实现它,所以我想知道是否可以通过一个实际的例子来获得帮助。
更新:读取数据的代码 (Jsoup)
url = new URL("http://www.example.com");
Document doc = Jsoup.parse(url, 4000);
【问题讨论】:
-
能否贴出用于读取html文档的代码?
标签: java android html html-parsing jsoup