【发布时间】:2018-04-21 10:32:33
【问题描述】:
我将使用 Pytorch 实现 RNN。但是,在此之前,我在理解问题中提出的字符级 one-hot 编码方面遇到了一些困难。
请在下面找到问题
选择您希望神经网络学习的文本,但请记住,您的 数据集必须相当大才能学习结构! RNN 已经过训练 在高度多样化的文本(小说、歌词、Linux 内核等)上取得成功,所以你 可以发挥创意。作为一个简单的选择,Gutenberg Books 是免费书籍的来源,其中 您可以下载 .txt 格式的完整小说。
-
我们将为此模型使用字符级表示。为此,您可以使用 具有 256 个字符的扩展 ASCII。当你阅读你选择的训练集时,你会 将字符一次读入一个热编码,即每个字符 将映射到一个由 1 和 0 组成的向量,其中一个表示哪个字符 存在:
char → [0, 0,····, 1,····, 0, 0] 您的 RNN 将读取这些长度为 256 的二进制向量作为输入。
所以,例如,我在 python 中读过一本小说。唯一字符总数为 97。总字符数约为 300,000。
那么,我的输入会是 97 x 256 一个热编码矩阵吗?
还是 300,000 x 256 一个热编码矩阵?
【问题讨论】:
标签: python-3.x recurrent-neural-network pytorch rnn