【发布时间】:2012-10-29 07:29:50
【问题描述】:
假设我有两个相对较大的制表符分隔文件 file1.txt、file2.txt。
file1.txt
id\tcity\tcar\ttype\tmodel
file2.txt
id\tname\trating
假设 file1.txt 有 2000 个唯一 ID,因此有 2000 个唯一行,而 file2.txt 只有 1000 个唯一行,因此有 1000 个唯一 ID。有没有办法合并两张表?
案例1.file1.txt中通过id合并,file2.txt中没有id时填写NAs。
案例 2。通过file2.txt中的id合并它们,此时只有file2.txt中的id会与file1.txt和file2.txt中的字段一起打印出来。
注意:合并后的新文件也应该是制表符分隔的文件,并带有头文件。 笔记2。如果没有标题,我也很感激有关如何做到这一点的建议。
谢谢!
【问题讨论】:
-
定义“合并”的含义
-
stackoverflow.com/questions/5467690/… 或 stackoverflow.com/questions/6393333/… 或“相关”侧边栏中的其他内容可能是相关的
-
@Bohemian by merge 我的意思是加入
-
@DavidZaslavsky 非常感谢,它看起来是一个很好的解决方案,但 join 需要对文件进行排序,并且 awk 在没有数据时不会添加 NA。您知道一些可以添加 NA 并保留标签的解决方案吗?