【问题标题】:UnicodeDecodeError: 'utf-8' codec can't decode bytes in position 0-1: invalid continuation byte [duplicate]UnicodeDecodeError:“utf-8”编解码器无法解码位置 0-1 中的字节:无效的继续字节 [重复]
【发布时间】:2019-08-07 03:46:05
【问题描述】:

我正在尝试在我制作的 csv 文件中尝试 pandas 方法,该文件如下所示:

Location  Time    Number
Seoul     Nov.11     5
Jinju      dec.22    2
wpg                  3
          june.6     2

类似的东西。它在标题中给了我一条错误消息。我该如何解决这个问题,它具体指的是什么位置?

【问题讨论】:

  • 该文件包含 utf8 编解码器无法解析的字符...在记事本 ++ 中打开您的 csv 并选择 encode > encode in utf8 ...它可能会工作...如果没有,很难诊断编码错误真实数据
  • 向我们展示您的代码!

标签: python pandas


【解决方案1】:

根据https://pandas.pydata.org/pandas-docs/stable/reference/api/pandas.read_csv.html,可以在读取csv文件时添加编码参数。我建议您添加“utf-8”或“ISO-8859-1”。 pandas.read_csv(yourfile, encoding="utf-8") 或 pandas.read_csv(yourfile, encoding="ISO-8859-1")

【讨论】:

    猜你喜欢
    • 1970-01-01
    • 2021-08-29
    • 1970-01-01
    • 2018-01-11
    • 2020-11-02
    • 2021-01-02
    • 2021-04-27
    • 1970-01-01
    • 1970-01-01
    相关资源
    最近更新 更多