动手学深度学习——学习笔记（Task2）

文本预处理

文本是一类序列数据，一篇文章可以看作是字符或单词的序列，本节将介绍文本数据的常见预处理步骤，预处理通常包括四个步骤：读入文本；分词；建立字典；将每个词映射到一个唯一的索引（index）将文本从词的序列转换为索引的序列，方便输入模型。

读入文本

动手学深度学习——学习笔记（Task2）

分词

动手学深度学习——学习笔记（Task2）

建立字典

动手学深度学习——学习笔记（Task2）

将词转化为索引

动手学深度学习——学习笔记（Task2）

语言模型

动手学深度学习——学习笔记（Task2）

语言模型的计算

动手学深度学习——学习笔记（Task2）

n元语法

动手学深度学习——学习笔记（Task2）

时序数据采样

动手学深度学习——学习笔记（Task2）

随机采样

动手学深度学习——学习笔记（Task2）

相邻采样

动手学深度学习——学习笔记（Task2）

总结

N元语法是基于n − 1阶马尔可夫链的概率语法模型，其中n权衡了计算复杂度和模型准性。

循环神经网络基础RNN

网络结构

动手学深度学习——学习笔记（Task2）

数学表达式

可以与多层感知机的表达式作比较
动手学深度学习——学习笔记（Task2）

代码实现

动手学深度学习——学习笔记（Task2）

总结

使用循环计算的网络即循环神经网络，循环神经网络的隐藏状态可以捕捉截止当前时间步的序列的历史信息，循环神经网络模型参数的数量不随时间步的增加而增加。

相关文章：

猜你喜欢

相关资源

相似解决方案

热门标签

Java Python linux javascript Mysql C# Docker 算法前端 SpringBoot Redis Vue spring 设计模式 .net core .net kubernetes c++ 数据库数据结构大数据 js 机器学习微服务 Android Go 程序员面试 JVM ASP.net core 云原生人工智能后端 PHP git CSS golang k8s Nginx Django mybatis 深度学习多线程 React 架构 devops 爬虫云计算 Spring Boot LeetCode