【发布时间】:2017-04-08 08:22:31
【问题描述】:
我正在准备一个用于手写识别的 TensorFlow 应用程序。我使用的是一个简单的 RNN 模型,最后是堆叠的 LSTM 单元和 CTC 损失。我对为输入数据准备标签有些困惑。
假设我有三个字符串作为目标标签"abc"、"ab" 和"baccc"(在我的情况下,目标标签是单词而不是句子)。所以我有三个字符类作为索引a:0, b:1, c:2, blank:3。据我了解,目标标签的密集表示应该是
0 3 1 3 2 0 0 0
0 3 1 0 0 0 0 0
1 3 0 2 3 2 3 2
但由于 TensorFlow 需要此标签的稀疏表示,我需要准备一个稀疏表示为
indices[(0,0),(0,1),(0,2),(0,3),(0,4),(1,0),(1,1),(1,2),(2,0),(2,1),(2,2),(2,3),(2,4),(2,5),(2,6),(2,7)]
values[0,3,1,3,2,0,3,1,1,3,0,2,3,2,3,2]
shape[3,8]
我对这个数据准备是否正确?非常感谢任何帮助。
【问题讨论】:
标签: python tensorflow