【发布时间】:2014-06-09 04:13:20
【问题描述】:
我正在努力寻找解决方案,希望有人能提供帮助。我有两个文件... File1 包含一长串为某些示例序列(单列)编码的唯一字符串。 File2 包含许多记录和许多列,但这里的记录组织了具有匹配样本序列的唯一字符串。我希望 AWK 在 File2 中搜索 File1 中的每个唯一字符串,并将 File1 中的唯一字符串重命名为 File2 的 $1 中找到的字符串,该字符串与找到唯一字符串的记录相对应。
文件1
id1
id2
id3
id4
id5
id6
id7
id8
id9
id10
文件2
id1,id9,id33,id35,id36,id37,id76
id5,id7,id8,id20,id22,id23
id6,id11,id13,id14
期望的输出
id1
id2
id3
id4
id5
id6
id5
id5
id1
id10
我的实际 File1 在 $1 中有大约 17,000 条记录,而 File2 有大约 4,000 条记录,有 1-400 个字段。任何帮助表示赞赏!
【问题讨论】:
标签: regex string bash awk match