【发布时间】:2019-03-12 18:47:26
【问题描述】:
嗨,我目前正在写我的论文,即为乌尔都语构建 OCR。我有文字,写在图像上。在 CNN 中,我知道有卷积层和池化层来学习模式或(提取特征)。我读到的关于 RNN 的内容是它学习序列。我想问RNN是怎么提取特征的,要知道,image里面是什么?
【问题讨论】:
标签: deep-learning conv-neural-network rnn
嗨,我目前正在写我的论文,即为乌尔都语构建 OCR。我有文字,写在图像上。在 CNN 中,我知道有卷积层和池化层来学习模式或(提取特征)。我读到的关于 RNN 的内容是它学习序列。我想问RNN是怎么提取特征的,要知道,image里面是什么?
【问题讨论】:
标签: deep-learning conv-neural-network rnn
RNN 网络使用随时间更新的隐藏层。采样并根据递减的误差(或损失)预测下一个样本。 LSTM 是一种 RNN,可以克服忘记长期依赖的问题。这种类型可能对你的论文有用。
【讨论】:
RNN 基本上在训练阶段需要一些特征和标签来学习数据中的序列。如果数值数据没有任何问题,我们只需将数据集划分为特征 (X) 和目标值 (Y)。但是对于图像数据,我们使用 CNN 和 RNN 的组合(CNN-RNN)。在 RNN 层(LSTM 或 GRU)的顶部,卷积层用于从图像中提取特征,然后我们将这些特征提供给 RNN 层。
【讨论】: