【问题标题】:allowing python to impoert csv with duplicate column names in python允许python在python中导入具有重复列名的csv
【发布时间】:2022-01-08 22:02:29
【问题描述】:

我有一个如下所示的数据框:

共有 109 列。 当我使用 read_csv 导入数据时,它会在重复名称中添加“.1”、“.2”。 有什么办法可以绕过吗?

我试过这个:

  df = pd.read_csv(r'C:\Users\agns1\Downloads\treatment1.csv',encoding = "ISO-8859-1", 
  sep='|', header=None)

  df = df.rename(columns=df.iloc[0], copy=False).iloc[1:].reset_index(drop=True)  

但它改变了数据框并且没有帮助。 这就是它对我的数据所做的 蟒蛇:

优秀:

【问题讨论】:

    标签: pandas dataframe csv duplicates multiple-columns


    【解决方案1】:

    删除header=None,因为它用于避免将文件的第一行转换为df.columns,然后从列名中删除带有数字的.

    df = pd.read_csv(r'C:\Users\agns1\Downloads\treatment1.csv',encoding="ISO-8859-1", sep=',')
    
    df.columns = df.columns.str.replace('\.\d+$','')
    

    【讨论】:

    • 它仍然像上图那样改变数据
    • @ElizaR - 你能解释更多吗?什么是改变数据?不是花车吗?还是字符串?
    • 当我在 excel 中再次打开它时,因为 csv ot 看起来像它进入了用逗号分隔的列表
    • 上面有一张图片的样子
    • @ElizaR - 但这是意料之中的,因为 excel 打开文件 csv 并带有逗号。
    猜你喜欢
    • 2022-01-03
    • 1970-01-01
    • 2020-02-07
    • 2015-07-23
    • 2015-02-26
    • 1970-01-01
    • 2019-02-23
    • 2019-01-10
    • 2019-06-22
    相关资源
    最近更新 更多