【问题标题】:How can I encode pandas with iso-8859-1?如何使用 iso-8859-1 对 pandas 进行编码?
【发布时间】:2021-04-25 12:58:01
【问题描述】:

我有熊猫相关的编码问题。 这是代码行:

data = pd.read_csv("data.csv", sep=";", encoding='ISO-8859-1', engine = 'python')

它可以工作,但它将字母 äÄ 和 öÖ 替换为 ""。 我怎样才能得到这份工作?

【问题讨论】:

    标签: python-3.x pandas dataframe csv


    【解决方案1】:

    我会通过以下方式检查 csv 文件的编码:

    with open("my_data.csv", 'rb') as rawdata:
        result = chardet.detect(rawdata.read(10000))
    print(result)
    

    它会返回类似:

    {'encoding': '<some encoding>', 'confidence': a float, 'language': 'finnish'}
    

    然后这样做:

    data = pd.read_csv("data.csv", sep=";", encoding='<some encoding>', engine = 'python')
    

    在哪里

    <some encoding> = the encoding of your file
    

    【讨论】:

    • 感谢您的回答。我让它可以处理数据,但如果 .csv 文件列名包含某些字母,它就无法处理它们。
    • 哪些字符?
    猜你喜欢
    • 2011-05-08
    • 1970-01-01
    • 2011-12-27
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 2011-02-12
    相关资源
    最近更新 更多