【发布时间】:2017-11-29 12:10:57
【问题描述】:
无法通过手册了解如何使用 syncsort 管理此问题(我们找到了 dfsort 的解决方案,但没有帮助)。 由于程序错误(无法及时修复,您知道:程序员、测试、质量检查、部署......)我们在一个文件 (FB/LRECL 250) 中得到了重复记录,然后
- 存在标题行
- 后续重复的数据行必须省略,但唯一的一行
- 数据行不得排序(由于某些记录的强制逻辑关系)
- 尾部包含数据行数。
由于文件大小(>2 条 mio 记录),无法手动编辑该文件。
示例文件:
HEADER xxxx
cccc
bbbb 123
bbbb 123
bbbb 123
dddd
aaaa 123
aaaa 123
aaaa
TRAILER COUNT: 8
预期输出:
HEADER xxxx
cccc
bbbb 123
dddd
aaaa 123
aaaa
TRAILER COUNT: 5
所以outfile根本没有排序,省略的记录
bbbb 123 (omitted)
bbbb 123 (omitted)
aaaa 123 (omitted)
根本不需要,可以直接进入涅槃。
(我什至会对省略页眉/拖车的解决方案感到满意,因为我可以在后续作业中轻松连接手动生成的行。)
感谢您的帮助!
【问题讨论】:
标签: duplicates syncsort