【发布时间】:2011-06-21 03:22:57
【问题描述】:
背景
根据单词和计数的 CSV 文件创建概率词典。这是文本分割问题的前奏,不是作业问题。
问题
给定一个包含以下单词和标签的 CSV 文件:
aardvark,10
aardwolf,9
armadillo,9
platypus,5
zebra,1
创建一个具有相对于文件中最大计数的概率的文件:
aardvark,1
aardwolf,0.9
armadillo,0.9
platypus,0.5
zebra,0.1
例如,aardvark,1 计算为aardvark,10/10,platypus,0.5 计算为platypus,5/10。
问题
实现 shell 脚本以创建相对概率文件的最有效方法是什么?
约束
- 单词和数字都没有顺序。
- 没有主要的编程语言(例如 Perl、Ruby、Python、Java、C、Fortran 或 Cobol)。
- 欢迎使用标准 Unix 工具,例如
awk、sed或sort。 - 所有概率都必须与文件中的最高概率相关。
- 单词是唯一的,数字不是。
- 计数是自然数。
谢谢!
【问题讨论】:
-
@Marshall:
bc不是“bashcalc”,它是“台式计算器”,因为dc是“台式计算器”。 -
@Dennis:谢谢,为您的困惑道歉
标签: bash math csv text-processing