【问题标题】:Special character not encoding Pandas不编码熊猫的特殊字符
【发布时间】:2019-01-23 22:16:31
【问题描述】:

我正在尝试使用 Pandas 将多个字段连接在一起。我以前成功地做到了这一点。我的问题是在两列之间我需要插入一个“à”特殊字符。无论我尝试什么,这个字符在导出到 csv 后总是变成一个问号。

我试过用excel和notepad++打开,不管我告诉程序编码是什么,都一样。

问题在于我的数据集和脚本中还有其他特殊字符,但它们的行为正常。

我试过了:

  • 将特殊字符专门编码为 utf-8
  • 将其转为变量,然后编码为utf-8
  • 最初在 pandas 中打开时对 csv 进行编码
  • 在导出时将 csv 写入新文件时对其进行编码
  • 仅使用特殊字符填充列 字符并将其与其余值连接

我想要的是这个:

401 À 403 RUE THOMAS LACHUTE 魁北克 J8H 4N7

我得到的是这样的:

401 ? 403 RUE THOMAS LACHUTE 魁北克 J8H 4N7

dfFromCRM.loc[((dfFromCRM['Province']=='QUEBEC') & (dfFromCRM['Street Number From']!=0), 
['Address'])]= dfFromCRM['Street Number From'].map(str)  + 'à' +  concatonateQuebec

【问题讨论】:

  • 能否请您发布可以运行的代码? (获取数据以及如何保存 CSV?)看起来你们中的一些代码被截断了。
  • 抱歉,现在正确了。

标签: python pandas utf-8 ascii special-characters


【解决方案1】:

如果您要将数据帧转换为 csv,则使用 utf-8-sig 作为编码。它可能有效 dataframe.to_csv(filepath,encoding='utf-8-sig', index=False)

【讨论】:

    猜你喜欢
    • 1970-01-01
    • 2021-02-23
    • 2018-02-02
    • 1970-01-01
    • 2016-02-26
    • 2011-12-28
    • 2016-10-19
    相关资源
    最近更新 更多