【发布时间】:2014-02-06 04:00:39
【问题描述】:
我想过滤一个日志文件以保持所有行匹配特定模式。我想用 Python 做到这一点。
这是我的第一次尝试:
#!/usr/bin/env python
from sys import argv
script, filename = argv
with open(filename) as f:
for line in f:
try:
e = line.index("some_term_I_want_to_match")
except:
pass
else:
print(line)
我该如何改进:
- 将结果保存到名称相似的新文件中(即不同的扩展名)
- 使用正则表达式使其更加灵活/强大。
(我只是在学习 Python。这个问题既是关于学习 Python,也是关于完成这个特定的结果。)
好的,这就是我到目前为止的想法......但是你如何做相当于在下面的行中添加r
re.compile(r"\s*")
其中的字符串不是字符串文字,如下一行所示?
re.compile(a_string_variable)
除此之外,我认为这个更新版本可以完成这项工作:
#!/usr/bin/env python
from sys import argv
import re
import os
import argparse #requires Python 2.7 or above
parser = argparse.ArgumentParser(description='filters a text file on the search phrase')
parser.add_argument('-s','--search', help='search phrase or keyword to match',required=True)
parser.add_argument('-f','--filename', help='input file name',required=True)
parser.add_argument('-v','--verbose', help='display output to the screen too', required=False, action="store_true")
args = parser.parse_args()
keyword = args.search
original_file = args.filename
verbose = args.verbose
base_file, ext = os.path.splitext(original_file)
new_file = base_file + ".filtered" + ext
regex_c = re.compile(keyword)
with open(original_file) as fi:
with open(new_file, 'w') as fo:
for line in fi:
result = regex_c.search(line)
if(result):
fo.write(line)
if(verbose):
print(line)
这可以轻松改进吗?
【问题讨论】:
-
为什么不使用
grep?如果您想使用正则表达式并坚持用 Python 编写,请查看re模块。 -
我认为这里不需要
try...except。 -
我更新了我的问题。我想用 Python 来做这件事,因为我正在学习 Python。