【发布时间】:2017-01-25 17:01:43
【问题描述】:
我假设如果我有 2 个相同的 data.frames,R 摘要函数应该返回相同的结果。考虑这两个数据帧。
library(digest)
library(dplyr)
df1 <- tibble(a =1:5, b=11:15)
df2 <- df1 %>%
mutate(c=b-1) %>%
select(-c)
两个 data.frames 在打印时是相同的,
> df1
# A tibble: 5 × 2
a b
<int> <int>
1 1 11
2 2 12
3 3 13
4 4 14
5 5 15
或比较:
> df1 ==df2
a b
[1,] TRUE TRUE
[2,] TRUE TRUE
[3,] TRUE TRUE
[4,] TRUE TRUE
[5,] TRUE TRUE
但是,摘要函数返回不同的结果:
> digest(df1)
[1] "4f82aa1035792a0acf304242ce6ad3ec"
> digest(df2)
[1] "3b7e697af67e8e36ba9b59aef69db304"
我希望摘要函数产生相同的结果! 有没有更好的方法来比较相同的 data.frames?
【问题讨论】: