【发布时间】:2011-03-07 02:02:00
【问题描述】:
我正在处理#huge# 文本文件(从 100mb 到 1gb),我必须解析它们以提取一些特定的数据。令人讨厌的是文件没有明确定义的分隔符。
例如:
"element" 123124 16758 "12.4" "element" "element with white spaces inside" "element"
我必须删除受“(引号)限制的字符串中的空格,问题是我不能删除引号“外部”的空格(否则某些数字会合并)。 我找不到合适的 sed 解决方案,有人可以帮我解决这个问题吗?
【问题讨论】:
标签: sed text-parsing