【发布时间】:2020-05-06 21:25:10
【问题描述】:
与 R 中的 unique 相比,BASH 中的 uniq 得到不同的结果。我的 df 看起来像(超过 9000 行):
samples read_seq
ccd_x29 GCATTGGT
ccd_x29 GCATTGGT
ccd_x29 GCATTGGT
ccd_x20 GCCCGGCTAG
ccd_x19 GCATTGGTGGTT
ccd_x19 GCATTGGTGGTT
在 bash uniq 之后我得到 8811 行,df <- unique(df) 我得到 8803 行。
这是什么原因造成的?
【问题讨论】:
-
对于示例中的示例,您能否显示 BASH 的输出
-
在输出上运行一个差异,看看两者之间有什么不同。
-
@akrun 我只是执行``` cat df |独特 | wc -l```获取bein uniq之后的行数。当我用 R 做
unique时,行数略有不同。 -
我无法通过您在
R中展示的示例nrow(unique(df1))# [1] 4并使用 bashcat tmp_today.txt | uniq | wc -l# 4来重现您的问题 -
@Apex 请发布一个显示差异的示例