【发布时间】:2019-05-12 04:01:04
【问题描述】:
我正在编写可以分析输入文本的代码。 我想寻求帮助的功能之一是按频率降序列出使用的单词。
通过引用堆栈溢出中的相似主题,我能够仅保留字母数字字符(删除所有引号/标点符号等)并将每个单词放入列表中。
这是我现在的清单。 (名为 word_list 的变量)
['Hi', 'beautiful', 'creature', 'Said', 'by', 'Rothchild', 'the', '最大','敌人','之','尊','尊','开始','得到','害怕', 'of','他','As','her','best','friend','Lia','can','feel', “她”、“恐惧”、“为什么”、“那个”、“那个”、“地狱”、“你”、“是”、“这里”]
(仅供参考,文本文件只是我从网上找到的随机同人小说)
但是,我无法将此列表修改为按频率降序排列的列表 - 例如,该列表中有 3 个“the”,因此“the”成为列表的第一个元素。下一个元素是 'of',出现 2 次。
我尝试了几件与我的案例类似的事情,但一直显示错误(计数器,已排序)。
谁能教我如何对列表进行排序?
另外,对列表进行排序后,如何只保留一份重复的副本? (我目前的想法是使用 for 循环和索引 - 与之前的索引进行比较,如果相同则删除。)
谢谢。
【问题讨论】:
标签: python python-3.x list sorting for-loop