【发布时间】:2012-02-15 22:55:28
【问题描述】:
我只需要打印具有相同第一个字段的各种连续行中的一个,并且该行必须是具有“最后一个字段中的更多字段”的行。这意味着最后一个字段是一组单词,我需要在最后一个字段中打印包含更多元素的行。如果最后一个字段的最大元素数相同,则任何最大值都可以。
示例输入:
("aborrecimento",[Noun],[Masc],[Reg:Sing],[Bulk])
("aborrecimento",[Noun],[Masc],[Reg:Sing],[Device,Concrete,Count])
("aborrecimento",[Noun],[Masc],[Reg:Sing],[])
("adiamento",[Noun],[Masc],[Reg:Sing],[])
("adiamento",[Noun],[Masc],[Reg:Sing],[Count])
("adiamento",[Noun],[Masc],[Reg:Sing],[VerbNom])
示例输出:
("aborrecimento",[Noun],[Masc],[Reg:Sing],[Device,Concrete,Count])
("adiamento",[Noun],[Masc],[Reg:Sing],[VerbNom])
使用 awk 的解决方案会很好,但不需要一个衬垫。
【问题讨论】:
-
试图提取我应该打印哪一行,然后打印该行本身,但无法猜测如何从各种候选者那里获取该行。
标签: awk duplicates