Task01
线性回归
softmax和分类模型
多层感知机
Task02
文本预处理
文本是一类序列数据,一篇文章可以看做是字符或单词的序列,文本数据常见的预处理步骤:
1.读入文本
2.分词
3.建立字典,将每个词映射到一个唯一的索引
4.将文本从词的序列转换成索引的序列,方便输入模型。
语言模型
思考:n元语法可能有哪些缺陷?
1.参数空间过大
2.数据稀疏
循环神经网络
Task01
线性回归
softmax和分类模型
多层感知机
Task02
文本预处理
文本是一类序列数据,一篇文章可以看做是字符或单词的序列,文本数据常见的预处理步骤:
1.读入文本
2.分词
3.建立字典,将每个词映射到一个唯一的索引
4.将文本从词的序列转换成索引的序列,方便输入模型。
语言模型
思考:n元语法可能有哪些缺陷?
1.参数空间过大
2.数据稀疏
循环神经网络
相关文章: