【发布时间】:2020-07-12 17:05:31
【问题描述】:
我的数据框看起来像这个例子,
其中 id 是唯一的,但 id 可以共享位置,例如 id 1 和 2 共享 0,0 单元格
| id | x | y |
-----------------------
1| 1 | 0 | 0 |
2| 2 | 0 | 0 |
3| 3 | 1 | 2 |
4| 4 | 1 | 0 |
.
.
我想获取室友的数据框,例如:
其中索引和列是根据 id 和值是 1 如果共享单元格,否则为 0
| 1 | 2 | 3 | 4 | ...
---------------------------
1| 0 | 1 | 0 | 0 |
2| 1 | 0 | 0 | 0 |
3| 0 | 0 | 0 | 0 |
4| 0 | 0 | 0 | 0 |
.
.
因为这是大数据框,所以函数需要向量化,而不是使用基本上循环遍历行的apply 方法
【问题讨论】:
标签: python pandas numpy location vectorization