【发布时间】:2017-07-23 06:44:27
【问题描述】:
我有这个文本文件
AAAA
1234
title example
Lorem Ipsum
FF
AAAA
1234
title example
€330 - Roma
FF
我想从这个文件中只提取以下文本:
START WITH AAAA
HAS Euro SYmbol
END WITH FF
在这种情况下,我只想匹配那个
AAAA
1234
title example
€330 - Roma
FF
我尝试了不同的解决方案 我用过
sed -e '/AAAAs/,/europ/,/FF/!d' testfile.txt
但它会提取 AAAA 和 FF 之间的所有 txet
我该如何解决?
感谢您的帮助
编辑:
欧元线和FF之间可能有一些文字。我不知道有多少行..
AAAA
1234
title example
€330 - Roma
Some text with \n, comma symbol etc etc
FF
我想提取 AAAA 和 FF 之间的 txt
【问题讨论】:
-
带有
€的行是否总是出现在AAAA的第4 行和FF之前? -
结构有点棘手,AAAA-A 标题,欧元符号,文本包含\n,和FF
-
棘手就像在它不需要一直那样吗?
-
你能试试我的回答看看有没有帮助?
-
@user3720159 如果 SLePort 的回答对您有所帮助,请通过接受他的回答来表明这一点。你可以在What should I do when someone answers my question?找到有关它的信息。
标签: python awk sed text-processing pcregrep