【发布时间】:2017-01-11 09:11:57
【问题描述】:
我一直在处理一个包含很多标点符号的文件,我们需要忽略标点符号,以便计算单词的实际长度。
例子:
这是堆栈溢出吗! ---> 这是堆栈溢出吗
在这样做的同时,我确实为每个标点符号写了很多案例,这使我的代码运行缓慢。所以我正在寻找一些有效的方法来使用模块或函数来实现相同的目标。
代码 sn-p:
with open(file_name,'r') as f:
for line in f:
for word in line.split():
#print word
'''
Handling Puntuations
'''
word = word.replace('.','')
word = word.replace(',','')
word = word.replace('!','')
word = word.replace('(','')
word = word.replace(')','')
word = word.replace(':','')
word = word.replace(';','')
word = word.replace('/','')
word = word.replace('[','')
word = word.replace(']','')
word = word.replace('-','')
所以形成这个逻辑我已经写了这个,那么有什么办法可以最小化这个吗?
【问题讨论】:
-
查看那些标点符号的ACSII值,它们应该在同一范围内。
标签: python string python-2.7 python-3.x