【发布时间】:2018-01-24 09:49:45
【问题描述】:
我有一个 csv 文件,其中有一列在字符串中包含 unicode,而另一列使用 UTF-8 正确读取
这里是第一行:
Col1 | Col2
热疗改造 | [“consommation \u00e9nerg\u00e9tique de b\u00e2timents publics”]
如何修复第二列,以便将 unicode 转换为重音?
编辑:我正在阅读 csv:
pd.read_csv('data.csv', delimiter=',', header=0 )
添加“encoding='utf-8'”变化不大
我正在保存 csv
df.to_csv('data.csv', encoding='utf-8', index=False)
并使用任一打印它
print(df[0:2]) or directly df
【问题讨论】:
-
CSV文件的编码是什么?你用什么代码来阅读它?如何打印结果以便看到`\u00e9nerg\u00e9tique`?
-
@LutzHorn 查看我的编辑,csv 编码为 UTF-8
-
我可以通过任何文本阅读器打开 csv 文件直接看到`\u00e9nerg\u00e9tique`
-
您是说您的 CSV 文件实际上包含字符“\u00e9nerg\u00e9tique”?这可以从源头上修复吗?
-
那么也许您应该请生成此 CSV 的人修复输出。
标签: python python-3.x unicode encoding utf-8