【发布时间】:2013-04-13 08:37:18
【问题描述】:
我正在我的程序中读取一个文本文件,其中包含一些 Unicode BOM 字符 \ufeff/65279。这在进一步解析中提出了几个问题。
现在我自己检测和过滤这些字符,但想知道 Java 标准库或 Guava 是否有办法更干净地做到这一点。
【问题讨论】:
-
在地方? BOM 应该是文件的第一个字节;否则它不是 BOM。
-
@bmorris591,是的,一开始。谢谢。如果您将第二条评论作为答案发布,我会将其标记为已接受。
标签: java file-io character-encoding guava