【发布时间】:2021-04-25 12:58:01
【问题描述】:
我有熊猫相关的编码问题。 这是代码行:
data = pd.read_csv("data.csv", sep=";", encoding='ISO-8859-1', engine = 'python')
它可以工作,但它将字母 äÄ 和 öÖ 替换为 ""。 我怎样才能得到这份工作?
【问题讨论】:
标签: python-3.x pandas dataframe csv
我有熊猫相关的编码问题。 这是代码行:
data = pd.read_csv("data.csv", sep=";", encoding='ISO-8859-1', engine = 'python')
它可以工作,但它将字母 äÄ 和 öÖ 替换为 ""。 我怎样才能得到这份工作?
【问题讨论】:
标签: python-3.x pandas dataframe csv
我会通过以下方式检查 csv 文件的编码:
with open("my_data.csv", 'rb') as rawdata:
result = chardet.detect(rawdata.read(10000))
print(result)
它会返回类似:
{'encoding': '<some encoding>', 'confidence': a float, 'language': 'finnish'}
然后这样做:
data = pd.read_csv("data.csv", sep=";", encoding='<some encoding>', engine = 'python')
在哪里
<some encoding> = the encoding of your file
【讨论】: