【发布时间】:2019-05-29 11:15:40
【问题描述】:
我的数据库中有一个非常大的游戏记录数据集。 假设一个数据框是其中的一部分,并代表一个游戏,例如:
+----------+------+------+-------+----------+------------+-----+----------------+
| _id_game | age | rank | grade | time | date | ... | _id_player |
+----------+------+------+-------+----------+------------+-----+----------------+
| key2589 | 14.0 | 1.0 | B | 00:02:34 | 2015/08/02 | ... | maximi-125 |
| key2589 | 28.0 | 2.0 | A | 00:02:50 | 2015/08/02 | ... | scooby-897 |
| key2589 | 16.0 | 3.0 | B | 00:03:21 | 2015/08/02 | ... | zorro-003 |
| key2589 | 30.0 | 4.0 | D | 00:03:45 | 2015/08/02 | ... | barabapapa-007 |
+----------+------+------+-------+----------+------------+-----+----------------+
上面这个数据框的每一行代表这个游戏的一个玩家。 我想让每一行的游戏中所有其他玩家的一些特征出现(因此每个玩家都与他的竞争对手进行比较)。
我想修改数据框:
+----------+------+------+-------+----------+------------+--------+--------+--------+----------+-----+----------------+
| _id_game | age | rank | grade | time | date | p1_age | p2_age | p3_age | p1_grade | ... | _id_player |
+----------+------+------+-------+----------+------------+--------+--------+--------+----------+-----+----------------+
| key2589 | 14.0 | 1.0 | B | 00:02:34 | 2015/08/02 | 28.0 | 16.0 | 30.0 | A | ... | maximi-125 |
| key2589 | 28.0 | 2.0 | A | 00:02:50 | 2015/08/02 | 14.0 | 16.0 | 30.0 | B | ... | scooby-897 |
| key2589 | 16.0 | 3.0 | B | 00:03:21 | 2015/08/02 | 14.0 | 28.0 | 30.0 | B | ... | zorro-003 |
| key2589 | 30.0 | 4.0 | D | 00:03:45 | 2015/08/02 | 14.0 | 28.0 | 16.0 | B | ... | barabapapa-007 |
+----------+------+------+-------+----------+------------+--------+--------+--------+----------+-----+----------------+
如您所见,我不会重复字段 date 或 _id_game。只是具体的领域,什么是球员的特点。
主要思想是对一个领域进行预测,同时考虑到其他竞争者的存在情况。
考虑到一个 df 只是一个游戏,我不知道如何在 pandas 数据框中执行此操作。考虑到数据帧包含一堆游戏,这更加复杂。
有人帮我吗?
【问题讨论】:
-
只是一种提醒,您可以接受您的问题下的答案(答案左侧的复选标记)