TensorFlow - 根据 CTC 损失层的空白标签索引答案

【问题标题】：TensorFlow - Index of Blank Label as per CTC Loss LayerTensorFlow - 根据 CTC 损失层的空白标签索引
【发布时间】：2016-07-16 18:38:51
【问题描述】：

我在理解标签 SparseTensor 应该具有哪些值超出实际标签长度时感到困惑。例如，假设我有标签 A-Z，索引为 0-26，目标标签是：

# 'H','E','L','L','O'
targ1=[7,4,11,11,14] 

# 'N','O'
targ2=[13,14]

sparse = [ [7,4,11,11,14],
           [13,14,0,0,0] ]

在稀疏中，第二批的实际成绩单显示为NOAAA，尽管它只是NO。所以我想知道TensorFlow在计算损失时如何处理这个问题。这不会让网络学会输出错误的字符序列吗？或者我可以让标签的索引范围在 1 到 27 之间，而不是从 0 到 26，因此强制网络仅输出 1-27 之间的类，但我无法说服自己即使这样也能完美运行。

另外我认为 CTC Loss 的 TensorFlow 手册没有提到空白标签的索引被假定为 N_Classes - 1，我在这里找到了：CTC Loss op。有人可以确认这样的假设是否正确吗？

我请求某人澄清我的疑问。感谢您的时间和支持。

【问题讨论】：

标签： tensorflow speech-recognition recurrent-neural-network

【解决方案1】：

CTC_OPS 来源声明

inputsTensor 最里面的维度大小，num_classes，代表 num_labels + 1 classes，其中 num_labels 是真实标签的数量，并且 最大值(num_classes - 1)留给空白标签。

【讨论】：

【解决方案2】：

我最近研究了语音识别，tensorflow中的SparseTensor表示它会在标签矩阵中添加0，所以0表示no-class，所以我认为blank-label类的索引是0，并且num_classes 是 1-27。

【讨论】：