【发布时间】:2012-10-11 19:10:40
【问题描述】:
所以我有一个文本文件,其中包含罗密欧与朱丽叶戏剧第 1 幕的剧本,我想计算某人说出一个词的次数。
这是正文:http://pastebin.com/X0gaxAPK
文本中有 3 个人在讲话:Gregory、Sampson 和 Abraham。
基本上,我想为三位演讲者中的每一个制作 3 个不同的词典(如果这是最好的方法吗?)。用人们分别说的单词填充字典,然后计算他们在整个脚本中说出每个单词的次数。
我该怎么做呢?我想我可以算出字数,但是对于如何区分谁说什么并将其放入每个人的 3 个不同的字典中,我有点困惑。
我的输出应该是这样的(这不正确,只是一个例子):
Gregory -
25: the
15: a
5: from
3: while
1: hello
etc
其中数字是该词在文件中出现的频率。
现在我已经编写了读取文本文件、去除标点符号并将文本编译成列表的代码。我也不想使用任何外部模块,我想用老式的方式来学习,谢谢。
您不必发布确切的代码,只需解释我需要做什么,希望我能弄清楚。我正在使用 Python 3。
【问题讨论】:
-
您可能想要使用字典,其中键是名称,值是您所描述的字典
标签: python file list dictionary