【发布时间】:2013-11-04 22:13:42
【问题描述】:
我有一个西里尔文的 .txt 文件。它的结构是这样的,但是是西里尔文:
city text text text.#1#N
river, text text.#3#Name (Name1, Name2, Name3)
lake text text text.#5#N (Name1)
mountain text text.#23#Na
我需要什么:
1) 查看一行中的第一个单词
2) 如果是“river”,则在“#3#”之后写入所有单词,即文件'river'中的名称(Name1,Name2,Name3)。
我还必须与行中的另一个第一个词有关,即。 e. 城市、湖泊、山脉。
我所做的仅查找第一个单词是否为“城市”并将整行保存到文件中:
lines = f.readlines()
for line in lines:
if line.startswith('city'):
f2.write(line)
f.close()
f2.close()
我知道我可以使用正则表达式来查找名称:#[0-9]+#(\W+),但我不知道如何将它实现到代码中。
我真的需要你的帮助!我很高兴能得到任何帮助。
【问题讨论】:
-
我已经编辑了我的帖子以使其更清晰ю
-
嗨!您可以使用 debuggex.com 尝试您的正则表达式!他们有一个 python 设置
标签: python regex file text nltk