【发布时间】:2021-12-16 12:32:01
【问题描述】:
对于这样的数据框:
| Col1 | Col2 | |
|---|---|---|
| 1 | A | D |
| 2 | B | A |
| 3 | C | B |
期望的结果:
Col1 和 Col2 中值的唯一出现次数,按行出现的顺序
即unique_list = [A, D, B, C]
问题
由于数据帧的数量和大小而最小化迭代和处理的方法
【问题讨论】:
标签: python pandas dataframe compare
对于这样的数据框:
| Col1 | Col2 | |
|---|---|---|
| 1 | A | D |
| 2 | B | A |
| 3 | C | B |
期望的结果:
Col1 和 Col2 中值的唯一出现次数,按行出现的顺序
即unique_list = [A, D, B, C]
问题
由于数据帧的数量和大小而最小化迭代和处理的方法
【问题讨论】:
标签: python pandas dataframe compare
使用DataFrame.iloc 选择前2 列,通过DataFrame.stack 重塑并在Series.unique 中获取唯一值:
unique_list = df.iloc[:, :2].stack().unique().tolist()
print (unique_list)
['A', 'D', 'B', 'C']
【讨论】: