【发布时间】:2021-11-27 09:30:11
【问题描述】:
经过多次试验,我设法将嵌套的结果列表转换为数据框。问题是这个dataframe中有嵌套的重复,无论我尝试哪种代码,我都无法解决问题。
这是数据框的头部:
> df[1:12]
TuteeID Tutee_Type Tutee_Syll_Cons
1: G313 A 0.7020889
2: G313 A 0.7573333
3: G313 A 0.7731556
4: G313 C 0.7020889
5: G313 C 0.7573333
6: G313 C 0.7731556
7: G313 D 0.7020889
8: G313 D 0.7573333
9: G313 D 0.7731556
10: G315 B 0.7762000
11: G315 B 0.8324222
12: G315 B 0.8560222
举例说明,对于单个 G313,我有 A、C 和 D 类型以及每种类型的一个一致性值。但在我的数据框中,每个一致性值都分配给每种类型。我需要这样的东西:
> df2
TuteeID Tutee_Type Tutee_Syll_cons
1 G313 A 0.7020889
2 G313 C 0.7573333
3 G313 D 0.7731556
4 G315 B 0.7762000
由于这种嵌套(我猜),到目前为止没有任何效果。我尝试了唯一、不同、重复、子集、组和切片......我还通过加入 2 个只有 TuteeID 和类型或一致性值的数据帧来创建这个数据帧,但即使这 2 个较小的数据帧没有重复,全局数据帧也有同样的问题。
你有解决办法吗?
【问题讨论】:
-
他们取消嵌套列表的方式是创建笛卡尔积。最好更改该逻辑,而不是稍后尝试修复它。最好提供以原始格式创建
df[1:12]的数据以及如何将其转换为 df,我们可以找出将其更改为df2
标签: r dataframe nested duplicates