1.3计算语言:简单的统计

 

频率分布

如何统计一篇文章中词频,使用下列语句即可实现,因为书中使用的python2,笔者在用python3时遇到一些小问题,蓝色小字给出了解决方案。

 

《Python自然语言处理》学习笔记

实际操作过程:

《Python自然语言处理》学习笔记

《Python自然语言处理》学习笔记

《Python自然语言处理》学习笔记

 

《Python自然语言处理》学习笔记

这个语句可以画出text1中50个最常用词的累计频率图

 

还可以设置一定条件,进行搜索

《Python自然语言处理》学习笔记

 

词语搭配和双连词

《Python自然语言处理》学习笔记

找到比我们基于单个词的频率预期得到的更频繁出现的双连词

 

 

计数其他东西

《Python自然语言处理》学习笔记

《Python自然语言处理》学习笔记

《Python自然语言处理》学习笔记

《Python自然语言处理》学习笔记

 

1.4 回到 Python:决策与控制

 

条件

关系运算符

 

对每个元素进行操作

《Python自然语言处理》学习笔记

去重,滤掉所有非字母元素, 从词汇表中消除数字和标点符号

 

 

 

参考:《Python自然语言处理》

相关文章: