【发布时间】:2016-02-24 11:37:30
【问题描述】:
我收到了包含我的项目的多张工作表的 excel 文件 (xslx)。这些工作表上的记录数量从每张工作表 15k 到 70k 不等。我需要对此数据执行以下任务,然后将其转换为 CSV。或者转换为 CSV,然后以任何方式处理数据。
输入示例:
call_no uniq_no Type Strength Description
2456 15 TX SomeSting SomeSting
5263 15 BLL SomeSting SomeSting
4263 162 TX SomeSting
2369 215 LH SomeSting
4269 426 BLL SomeSting SomeSting
7412 162 TX SomeSting SomeSting
根据我需要的要求
- 在“uniq_no”列中查找重复值并删除除原始记录(第一条记录)之外的所有重复记录。
- 用数据替换空白。 (只需简单的查找空白并用值逻辑替换)
- 删除任何单元格中的空格/制表符空格。 (这点不重要,就像一个支线任务)
输出示例:
call_no uniq_no Type Strength Description
2456 15 TX SomeSting SomeSting
4263 162 TX **NewDATA** SomeSting
2369 215 LH SomeSting **NewDATA**
4269 426 BLL SomeSting SomeSting
这对我来说是例行任务。我对 shell 脚本有相当的了解。因此,如果有人可以指导我,即使是粗略的脚本大纲,我也可以在最后进行调整。请帮忙。
【问题讨论】:
标签: excel shell csv unix ubuntu