【发布时间】:2018-04-12 08:18:20
【问题描述】:
我的数据集如下:
Product_1 Product_2
A B
A A
A C
C D
B C
E E
Z Z
表中说的是,产品 A 实际上是产品 B,那么产品 A 当然是产品 A,产品 A 也与产品 C 相同,但考虑到产品 C 是产品 D,最终产品 A 也是与产品 D 相同。
我需要在此表中添加一列,将所有相同的产品分组如下:
Product_1 Product_2 Group
A B 1
A A 1
A C 1
C D 1
B C 1
E E 2
Z Z 3
我正在使用 R,因此我正在考虑将递归 CTE 与 sqldf 包一起使用。 这是大数据,所以使用矩阵来解决问题会让我超过 1.3 TB,而我没有。 有人知道怎么做吗?
【问题讨论】:
标签: sql r sqlite recursion sqldf