【问题标题】:How to split a text file into 2 parts based on 3 (or more) newlines in bash如何根据 bash 中的 3 个(或更多)换行符将文本文件拆分为 2 个部分
【发布时间】:2018-09-05 06:23:06
【问题描述】:

我有一个简单的文本文件,我想把它分成两部分 每当我看到 3 个(或更多)连续的新行。例如:

Fiona Gallagher
Frank Gallagher
Sheila Jackson



Dominique Winslow
Kermit

应该创建 2 个文本文件:

Fiona Gallagher
Frank Gallagher
Sheila Jackson

Dominique Winslow
Kermit

虽然 SO 中的类似帖子解决了将文本文件分成两部分的问题(this PHP solutionthis C# solutionand this Java solution),但我在 bash 中找不到解决方案。一个简洁的 bash 解决方案在某处(?)似乎很合理。 谢谢!

【问题讨论】:

  • 你反对常见的 GNU 命令,比如csplit
  • 最好混合使用 grep、sed、cat 和 awk,但也请发布任何其他解决方案。
  • 这不是纯粹的 bash,所以您可能想在问题中具体说明。
  • @kabanus 你能重新发布你的 csplit 解决方案吗?我认为 csplit 有一个可能的解决方法。
  • 我做了,希望有用。

标签: bash split text-files


【解决方案1】:

应 OP 的要求,csplit 解决方案仅适用于 2 个连续的 \n\n 或更多。


最简单的方法是使用任何现代bash 系统都有的GNU csplit。假设bla 包含:

Fiona Gallagher
Frank Gallagher
Sheila Jackson

Dominique Winslow
Kermit






a
v
b

然后

csplit --suppress-matched -z bla "/^$/" '{*}'

会做你想做的,创造

>cat xx00 
Fiona Gallagher
Frank Gallagher
Sheila Jackson
>cat xx01
Dominique Winslow
Kermit
>cat xx02
a
v
b

您可以使用-f--prefix=xx 更改为任何前缀。 --suppress-matched 确保您拆分的内容(空行)不会被输出,-z 确保连续的空行不会形成空文件。 {*} 表示尽可能多地拆分。

【讨论】:

  • 你能强制执行至少 3 个连续的换行符吗?
  • @OrenIshShalom 啊,不抱歉。我会删除答案。我以为是2。
  • 按要求恢复了答案。
猜你喜欢
  • 1970-01-01
  • 2018-09-13
  • 1970-01-01
  • 2012-07-04
  • 2022-11-16
  • 1970-01-01
  • 1970-01-01
  • 1970-01-01
  • 1970-01-01
相关资源
最近更新 更多