【问题标题】:Reshape dataframe of list to another dataframe将列表的数据框重塑为另一个数据框
【发布时间】:2019-04-16 10:10:42
【问题描述】:

我有一个这样的名称和列表数据框:

| Name | value |
|:-----|------:|
| A    |[1,4,7]|
| A    |[9,2,5]|
| A    |[6,9,3]|
| A    |[1,4,7]|
| A    |[9,2,5]|
| B    |[6,9,3]|
| B    |[1,4,7]|
| B    |[9,2,5]|
| B    |[6,9,3]|
| B    |[1,4,7]|

我想将此数据框重塑为另一个数据框,因为所有名称都会有 3 个这样的列表:

| Name |   value   |
|:-----|----------:|
| A    |[1,9,6,1,9]|
| A    |[4,2,9,4,2]|
| A    |[7,5,3,7,5]|
| B    |[6,1,9,6,1]|
| B    |[9,4,2,9,4]|
| B    |[3,7,5,3,7]|

有没有更简单的方法可以通过使用 pandas 来做到这一点?

【问题讨论】:

  • 在我看来 numpy 应该在这里有所帮助。
  • 这看起来像一个转置,然后是一个枢轴

标签: python pandas numpy dataframe pandas-groupby


【解决方案1】:

使用groupby+pd.Series+melt

df2 = df.groupby('Name').apply(lambda s: pd.Series([s['value'].str[k].agg(list) for k 
in range(3)])).T.melt()

数据框如下所示:

   Name         value
0   A       [1, 9, 6, 1, 9]
1   A       [4, 2, 9, 4, 2]
2   A       [7, 5, 3, 7, 5]
3   B       [6, 1, 9, 6, 1]
4   B       [9, 4, 2, 9, 4]
5   B       [3, 7, 5, 3, 7]

【讨论】:

    【解决方案2】:

    你可以,但是很多更好的主意是将你的列表分成单独的系列:

    res = pd.concat((pd.DataFrame(np.array(grp['value'].tolist()).T.reshape(3, -1))\
                     .assign(Name=key) for key, grp in df.groupby('Name')),
                    ignore_index=True)
    
    print(res)
    
       0  1  2  3  4 Name
    0  1  9  6  1  9    A
    1  4  2  9  4  2    A
    2  7  5  3  7  5    A
    3  6  1  9  6  1    B
    4  9  4  2  9  4    B
    5  3  7  5  3  7    B
    

    【讨论】:

      猜你喜欢
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      • 2022-08-13
      • 2020-06-05
      • 2014-10-10
      相关资源
      最近更新 更多