【发布时间】:2018-04-26 15:52:38
【问题描述】:
我正在尝试组合特定问题以形成新的组合问题,其值是组合问题的平均值。我只想要特定 id 的平均值。在下面的示例中,我尝试将问题 1 和 2(abc 和 def)组合起来,然后生成一个包含每个参与者的两个值的平均值的列(由 id 表示)。
这是原始数据框的示例:
id question qnumber value
1 abc 1 1
1 def 2 3
1 ghi 3 4
2 abc 1 2
2 def 2 4
2 ghi 3 1
这就是我希望数据框的样子。
id question qnumber value
1 abcdef 1 2
1 ghi 3 4
2 abcdef 1 3
2 ghi 3 1
在我的实际数据集中,我有 17 个问题,我想组合 3 对问题,产生 14 个问题(11 个独立问题和 3 个来自组合问题)。我不在乎生成的“问题”列是否具有与上述相同样式组合的问题名称,但我认为这会使事情更容易理解。 qnumber 列不是很重要,但我不确定基于数字(如“qnumber”)而不是基于字符串(如“问题”),所以我把它包括在内。
【问题讨论】: