【发布时间】:2011-03-02 15:11:24
【问题描述】:
我需要将来自不同系统的不同格式的文件导入我们的数据库。导入过程的一部分是检查行长以确保格式正确。 我们似乎遇到了来自添加了一个字符的 UNIX 系统的文件的问题。我怀疑这是由于 UNIX 和 Windows 平台上的回车编码不同。
除了检查行的最后一个字符之外,有没有办法检测文件是在哪个文件系统上创建的?或者也许是一种将文件读取为文本而不是二进制文件的方式,我怀疑这是问题所在?
谢谢各位!
【问题讨论】:
-
一些字符,例如英国英镑符号£在 UTF8 中是两个字节。你是怎么测量长度的? DB中的目标字符集是什么?
-
标题和标签(文件系统)具有误导性。
标签: java text file cross-platform newline