【发布时间】:2012-07-29 06:22:40
【问题描述】:
我有一个大约 25,000 行的文本文件。大约 525kb。
有些行的开头有随机文本。 有些有很长的分号字符串。
其他一些只有三个分号,然后是一个空格和可选的更多文本在同一行。这些是我要删除的行。
这是一个示例......
;;; Updated Time 20120706122706
;;; Generic DEveloper Output
;;; Some Random Comments
;;; I got some more...
;;; Yet another uneeded line
;;; Thanks for using StackOverflow <http://stackoverflow.com>, or...
;;; Not.
;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;; Banana Production
[Data_Release_Version]
Version=12586
Released=20120706122706
;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;; Baseline Properties
[BaseLineProperties]
Comment=BaselineProperties
----- 等等。
一旦到达第一行 4 或更多 ;在线上,我需要文件的其余部分,因为没有“;;;”行。
尝试快速找到一些东西,而不是读取所有行并在它不匹配时将其写回 ";;; "。
文件是 ASCII(可能是 UTF-8)文本类型文件。
有什么想法吗?
感谢您的时间、帮助和知识。
【问题讨论】:
-
你能试着再解释一下你想要什么。这不是很清楚。是否要删除超过 4 个分号的行?
-
我想删除以“;;;”开头的行,而不是包含多于或少于 3 个分号然后是空格的行。一旦我连续击中 4 个或更多分号的行,我就可以停止删除行。我基本上想删除一个开头有随机行数的标题。