【发布时间】:2021-07-13 08:56:34
【问题描述】:
非常感谢您对此提供的帮助。我正在使用 jupyter 笔记本。
我有一个数据框,我想在其中计算评估者间的可靠性。我想通过 ID 列的值对它们进行成对比较(所有 ID 的频率为 2,每个编码器一个)。所有 ID 值都代表不同的文章,因此我不想将它们全部比较,但更多的是取每对(也可能是每列)的评估者间可靠性的平均值。
N. ID. A. B.
0 8818313 Yes Yes 1.0 1.0 1.0 1.0 1.0 1.0
1 8818313 Yes No 0.0 1.0 0.0 0.0 1.0 1.0
2 8820105 No Yes 0.0 1.0 1.0 1.0 1.0 1.0
3 8820106 No No 0.0 0.0 0.0 1.0 0.0 0.0
我已经能够找到一些关于 cohen 的 k 的说明,但没有找到如何在 ID 列中按值成对执行此操作的说明。
有人知道怎么做吗?
【问题讨论】:
-
右边的 0 和 1 是什么?它们是否相关?
-
在你的例子中,只有 ID 8818313 有两个编码器。这是预期的吗?是否应该删除只有一个编码器的 ID?
-
@Anna 如果它解决了您的问题,请接受它作为最终答案。谢谢。
标签: arrays pandas pairwise cohen-kappa