【发布时间】:2017-05-01 18:49:38
【问题描述】:
输出目标:
Apache 2.0.44 (Linux) - 2
Cisco IOS - 4
Linux Kernel 2.4.20 - 1
Microsoft IIS 5.0 < 5.1 - 2
电流输出 m.group(1):
Apache 2.0.44 (Linux)
Apache 2.0.44 (Linux)
Cisco IOS
Cisco IOS
Cisco IOS
Cisco IOS
Linux Kernel 2.4.20
Microsoft IIS 5.0 < 5.1
Microsoft IIS 5.0 < 5.1
我有一个 CSV 文件,我成功地从第 3 列(称为标题)获取输出并从中删除一些不需要的内容(我只想要那一行中的内容,并希望删除“-”之后的所有内容")
import sys, csv, operator, re
reader = csv.reader(open("test.csv"), delimiter=",")
sortedlist = sorted(reader, key=operator.itemgetter(2), reverse=False)
for id, path, title, date, author, platform, type, port in sortedlist:
m = re.search(r'^(.*?)\-.*', title)
if m:
print m.group(1)
现在我需要 m.group(1) 的内容来删除重复但显示它出现的次数。使用Counter 计算每个项目的每个字母...我不知所措。
【问题讨论】:
-
你的意思是你只想要那个列的内容,不是吗?
-
根据您在几个答案下的 cmets,您似乎留下了一些重要的细节,说明您希望如何计算标题略有不同的不同项目。请澄清这一点。
标签: python sorting csv count counter