【问题标题】:HtmlCleaner returns "???" when parsing non-english web siteHtmlCleaner 返回“???”解析非英文网站时
【发布时间】:2011-10-10 20:42:02
【问题描述】:

当我尝试用HtmlCleaner 解析GoogleApple 之类的网站时,一切正常。 但是当我尝试解析一个中文网站时,文本看起来像这样“???”。

是什么导致了这个问题,我该如何解决?

【问题讨论】:

  • 你在哪里看到???在文本中?你在控制台上打印它吗?您是否将其保存到文件中?可以给我们看一些源代码吗?

标签: java unicode character-encoding htmlcleaner


【解决方案1】:

字符编码问题。在对内容进行任何操作之前,您需要根据内容设置编码。

【讨论】:

  • 我建议您稍微改进一下您的回复(被某人标记为“低质量帖子”),即解释编码在 HTML 中的位置,以及如何设置编码。
猜你喜欢
  • 1970-01-01
  • 1970-01-01
  • 2013-05-14
  • 1970-01-01
  • 2012-09-09
  • 1970-01-01
  • 2022-01-11
  • 1970-01-01
  • 1970-01-01
相关资源
最近更新 更多