【发布时间】:2014-12-08 05:31:06
【问题描述】:
我正在开展一个 Talend 项目,我们正在将数据从 1000 个 XML 文件转换为 CSV,并且我们正在从 Talend 本身创建 CSV 文件编码为 UTF-8。
但问题是某些文件是作为 UTF-8 创建的,而其中一些是作为 ASCII 创建的,我不确定为什么会发生这种情况。文件应该始终创建为 UTF。
【问题讨论】:
-
什么告诉你你的文件是 ASCII 或 UTF8
-
我在 Linux 系统上使用逗号
file FileName。 -
ASCII 是 UTF8 的有效子集。如果您的文件不包含 ASCII 字符以外的任何内容,那么即使文件输出为 UTF8,它也会被视为 ASCII。
标签: csv encoding ascii talend utf