【发布时间】:2018-10-23 09:31:22
【问题描述】:
我有一个 csv 文件
value name date sentence
0000 name1 date1 I want apples
0021 name2 date1 I want bananas
0212 name3 date2 I want cars
0321 name1 date3 I want pinochio doll
0123 name1 date1 I want lemon
0100 name2 date1 I want drums
1021 name2 date1 I want grape
2212 name3 date2 I want laptop
3321 name1 date3 I want Pot
4123 name1 date1 I want WC
2200 name4 date1 I want ramen
1421 name5 date1 I want noodle
2552 name4 date2 I want film
0211 name6 date3 I want games
0343 name7 date1 I want dvd
我想在名称选项卡中找到唯一值(我知道我必须使用 -f 2 但我也想知道它们出现了多少次/它们的句子数量。
eg: name1,5
name2,3
name3,2
name4,2
name5,1
name6,1
name7,1
然后我想再做一个关于每次出现多少人的数据
1 appearance, 3
2 appearance ,2
3 appearance ,1
4 appearance ,0
5 appearance ,1
【问题讨论】:
-
我认为实际的 csv 文件看起来有点不同。您的示例在两个字段之间有 2 步。能否给出实际格式(分隔符可以是','或';'或'^')?