【发布时间】:2021-01-16 05:34:52
【问题描述】:
我希望从同一目录中读取多个 CSV 文件并将它们存储到单独的 pandas dfs 中。 CSV 没有相同的列标题。该代码成功列出了目录中的所有 csv 文件,但是当我运行其余文件时它会出错。这是我目前的代码:
import pandas as pd
import os
import glob
path = "/file/path/"
all_files = glob.glob(os.path.join(path, "*.csv"))
for file in all_files:
file_name = os.path.splitext(os.path.basename(file))[0]
dfn = pd.read_csv(file)
dfn.index.name = file_name
我收到错误消息“UnicodeDecodeError: 'utf-8' codec can't decode byte 0xa3 in position 137: invalid start byte”。
【问题讨论】:
-
您的分隔符可能与默认的逗号不同。
-
我将如何检查/更改这个?
-
您是否尝试在文本编辑器中打开文件?
-
我检查了其中的一些,它们似乎是用逗号分隔的
标签: python pandas dataframe csv