【问题标题】:Opening CSV with UTF-8 BOM via Excel通过 Excel 使用 UTF-8 BOM 打开 CSV
【发布时间】:2013-12-15 01:01:45
【问题描述】:

我通过java创建带有数据的csv文件。我遇到了以下众所周知的问题:葡萄牙语中的字母在 Excel 中以错误的方式显示(双击打开时)。

我通过 UTF-16LE+BOM 解决了这个问题,但 excel 开始将制表符识别为列分隔符而不是逗号。

所以我寻找另一个解决方案并看到很多帖子,其中人们说只需添加 UTF-8 BOM 并以 UTF-8 写入文件就可以为 Excel 2007 及更高版本完成工作。我在我的工作计算机上尝试了最简单的示例,但它失败了。但是当我在家里的电脑上尝试这个时,它就像一个魅力。

两台计算机都安装了相同版本的 java 和操作系统 Windows 7。 我很迷惑。谁能说出是什么导致了这种奇怪的行为?

您可以在下面查看我最简单的示例:

String filename = "D:/check/test_with_bom.csv";
        FileOutputStream fos = new FileOutputStream(filename);
        byte[] bom = new byte[] { (byte)0xEF, (byte)0xBB, (byte)0xBF }; 
        fos.write(bom);
        OutputStreamWriter osw = new OutputStreamWriter(fos , "UTF-8");
        PrintWriter printWriter = new PrintWriter(osw);

        printWriter.print("Hello,Olá,ão,ção");
        printWriter.close();

【问题讨论】:

  • Excel 版本是否相同?
  • 你为什么要创建那个过时的PrintWriter?在Writer 上调用write 比在PrintWriter 上调用print 更难吗?
  • Robin Green,我猜是的 - 两台机器都有 2007 Excel。我看到的明显区别是在工作机器上我有俄语 excel。
  • Holger,将 print 更改为 write 不会改变结果。这只是一个测试样本,我写它是为了证明这种方法的可能性。

标签: java excel csv utf-8


【解决方案1】:

您应该知道 Excel 不会“打开”csv 文件。它使用默认值即时将它们转换为 Excel 文件。这些默认值可能因您的区域设置而异。正因为如此,it's never a good idea to let Excel open csv files using the defaults,因为你永远无法确定你最终会得到什么。

更安全的方法是使用“从文本导入”方法,并明确指定分隔符、编码等...但是,请注意,在 Excel 中“另存为 csv”是一个更糟糕的主意,因为它确实不允许您指定编码、分隔符或任何其他详细信息。访问。

在美国 Windows 版本的 Excel 中,默认的列分隔符是逗号。在欧洲 Windows 版本中,逗号是为十进制符号保留的,为了避免冲突,默认情况下使用分号作为列分隔符。

如果您 -rely- -rely- -have- 使用 CSV,您可以考虑在 csv 文件的顶部添加 "sep=," indicator。但是,请注意,这可能会导致其他应用程序出现问题。

【讨论】:

  • 是的,我知道通过 excel 打开它们不是一个好主意,但是客户希望通过双击在 excel 中打开 csv 并希望逗号作为列分隔符。无论如何,我停止使用 UTF-8 BOM。你说的是区域设置,你到底是什么意思?感谢您的意见。
  • 嘿,我在答复中添加了两段。但是,当使用 CSV 时,客户端将添加或更改数据并保存文件,请务必向他们解释在 CSV 文件上使用“保存”的限制,而不是明确执行导出。
猜你喜欢
  • 2014-05-28
  • 2016-05-04
  • 2019-08-14
  • 2020-01-25
  • 2018-10-28
  • 2023-03-29
  • 2020-06-01
  • 2011-02-04
  • 2015-11-11
相关资源
最近更新 更多