【发布时间】:2020-12-10 22:12:23
【问题描述】:
我有以下包含 171 个文件的数据集。
CHR:POS REF:ALT BREED
6:85406127 T:A 0.333333
6:85406128 T:C 0
6:85406129 C:G 0.333333
6:85406130 T:G 0.833333
想要的输出是
CHR:POS REF:ALT BREED BREED2 BREED3 ... 171st file
6:85406127 T:A 0.333333 0.33 0.5 .... 0.4
6:85406128 T:C NA 0.33 0.5 .... 0.4
6:85406129 C:G 0.333333 0.33 NA .... 0
6:85406130 T:G 0.833333 0.33 0.5 .... NA
文件名包含品种名称。第一列和第二列在每个文件中都包含相同的信息。如何仅从每个文件中提取第三列,同时保留第一个文件中的所有列?
我将第一个文件移动到其他文件夹以从提取中排除。下面的命令没有给出结果。
cut -d " " -f3 *.txt | paste ../breedname.txt - > output.txt
我也尝试过使用这些问题中显示的 awk 命令,但它不适用于我的数据集。
欢迎任何帮助!
【问题讨论】:
-
欢迎来到 SO 并特别感谢您展示您的尝试,继续努力。您能否确认一下您所有文件的 1st 2 字段是否相同?
-
感谢您的盛情款待!是的,每个文件中的第一个和第二个字段都是相同的。