【发布时间】:2017-08-11 15:04:39
【问题描述】:
我有一个数据框,其中我有重复的值(在每一列中没有重复的行)。 数据如下:
|Col1|Col2|Cold3|Col4|
| 1| A| John| -10|
| 2| A|Scoot| 234|
| 2| B|Kerry| 346|
| 6| B| Adam| -10|
我想从这个创建另一个 df,看起来像这样:
|Col1|Col2|Cold3|Col4|
| 1| A| John| -10|
| 2| B|Scoot| 234|
| 6|null|Kerry| 346|
|null|null| Adam|null|
当然,那些 null 可能是 NaN。
我可以遍历每一列并为每一列打印唯一值:
for col in df:
print (df[col].unique())
返回 numpy 数组。 但我不确定如何将它写入新的数据框以使其看起来像我之前展示的那样。
【问题讨论】: