【发布时间】:2019-02-11 10:17:31
【问题描述】:
我有多个 .txt 文件,其中的信息在转换后如下所示:
> ** ** **|** ** STYLE # ** **|** ** DESCR : Potrero415;Tbl-
Rnd ** **\--------** ** ** **\--** **ZONE 1** **\--**
** ** **\--** **ZONE 2** **\--** ** ** **\----** ** -T1-
-T2- -T3-
**
我想获取从 DESCR: 到下一行开始的所有内容 ** **\--** ** ZONE 2 **
所以我的字符串应该是这样的:DESCR : Potrero415;Tbl-Rnd
请注意,在此特定部分之前的文件中有多行文本,并且 DESCR 一词仅出现在我要复制的位置,之前没有其他出现。
我知道在** **\出现之前可以使用split
所有文件格式相同,只需从DESCR:到** **查找即可
我知道我冒着在这篇文章上投反对票的风险。 更新: 我设法找到了这个词的外观:
lines = test.readlines()
test.close()
for line in lines:
line = line.strip()
if line.find("DESCR") != -1:
print("FOUND")
test 是我打开的文件
【问题讨论】:
-
到目前为止你有什么尝试?
-
立即更新:)
-
“转换后”,什么样的转换?
-
使用 html2text 从 .htm 到 .txt
-
你说可以用split,那你为什么不用呢?