【发布时间】:2015-02-27 12:40:28
【问题描述】:
我有一个 ID 列表和这些 ID 所在的位置。现在我想找到最有共同点的 id 对。
我的数据框如下所示:
id place
Dave Paris
Dave Moscow
Dave New York
Joe New York
Joe Tokyo
Stuart Paris
Stuart Moscow
Stuart New York
Stuart Tokyo
结果应如下所示:
pair1 pair2 count
Dave Joe 1
Dave Stuart 3
Joe Stuart 2
我尝试过 split 来划分数据:
temp = split(df$name, df$place)
所以我现在将地点分组,但我没有进一步。
原始数据集有大约 100.000 个唯一 ID。
谁能帮我找到一个好的和快速的解决方案? 谢谢!
【问题讨论】:
标签: r