【发布时间】:2020-02-25 13:48:09
【问题描述】:
我有一个看起来很乱的文件:
contig_1 bin.0013 Rhizobium flavum (taxid 1335061)
contig_2 Alphaproteobacteria (taxid 28211)
contig_3 bin.009
contig_4 bin.008 unclassified (taxid 0)
contig_5 bin.001 Fluviicoccus keumensis (taxid 1435465)
contig_12 bin.003
我希望它与制表符分隔的列和空的零看起来正确:
contig_1 bin.0013 Rhizobium flavum (taxid 1335061)
contig_2 0 Alphaproteobacteria (taxid 28211)
contig_3 bin.009 0
contig_4 bin.008 unclassified (taxid 0)
contig_5 bin.001 Fluviicoccus keumensis (taxid 1435465)
contig_12 bin.003 0
如果我使用 sed 's/ /,/g' filename 之类的东西,除了 1-2 和 2-3 列之外的任何地方都插入逗号。
【问题讨论】:
-
尝试
column命令 -
我试过了,还是没有解决问题。
-
这并不像你想象的那么简单。查看您的第一个文件,我假设应该有 5 个字段(
config_1、bin.0013、Rhizobium、flavum、(tax id ...))。然而事实证明只有 3 个。 -
是的,这来自输入文件,其名称类似于
Rhizobium flavum (taxid 1335061)和空格。虽然我希望应该有办法