允许python在python中导入具有重复列名的csv

【问题标题】：allowing python to impoert csv with duplicate column names in python允许python在python中导入具有重复列名的csv
【发布时间】：2022-01-08 22:02:29
【问题描述】：

我有一个如下所示的数据框：

共有 109 列。当我使用 read_csv 导入数据时，它会在重复名称中添加“.1”、“.2”。有什么办法可以绕过吗？

我试过这个：

  df = pd.read_csv(r'C:\Users\agns1\Downloads\treatment1.csv',encoding = "ISO-8859-1", 
  sep='|', header=None)

  df = df.rename(columns=df.iloc[0], copy=False).iloc[1:].reset_index(drop=True)

但它改变了数据框并且没有帮助。这就是它对我的数据所做的蟒蛇：

优秀：

【问题讨论】：

标签： pandas dataframe csv duplicates multiple-columns

【解决方案1】：

删除header=None，因为它用于避免将文件的第一行转换为df.columns，然后从列名中删除带有数字的.：

df = pd.read_csv(r'C:\Users\agns1\Downloads\treatment1.csv',encoding="ISO-8859-1", sep=',')

df.columns = df.columns.str.replace('\.\d+$','')

【讨论】：

它仍然像上图那样改变数据
@ElizaR - 你能解释更多吗？什么是改变数据？不是花车吗？还是字符串？
当我在 excel 中再次打开它时，因为 csv ot 看起来像它进入了用逗号分隔的列表
上面有一张图片的样子
@ElizaR - 但这是意料之中的，因为 excel 打开文件 csv 并带有逗号。