【发布时间】:2017-06-12 07:16:56
【问题描述】:
我有一个包含一些字符串的文本文件,例如:
test2@gmail.com:123456
test2@hotmail.com:124554134
test1@yahoo.com:fdsfsdfe
test5@gmail.com:9875464
现在我想通过 python 删除 .com 之前的所有字符串。
我的代码(但错误):
import re
myline = open("file.txt" ,"r").readlines()
for single_line in myline:
spline= single_line.rstrip()
result = re.sub("\.com$", "", spline)
print (result)
我该怎么办? 谢谢
【问题讨论】:
-
你想得到
123456、124554134、fdsfsdfe、9875464吗?标准是在.com第一次出现后得到所有吗?或者也许与:分开就足够了。请澄清。 -
myline已包含此文件的内容。无需迭代。正则表达式可以捕获所有匹配项。使用re.findall或re.finditer,您将获得所有匹配项的数组。 -
...但是将 .readlines 更改为 read()