【问题标题】:TensorFlow - Index of Blank Label as per CTC Loss LayerTensorFlow - 根据 CTC 损失层的空白标签索引
【发布时间】:2016-07-16 18:38:51
【问题描述】:

我在理解标签 SparseTensor 应该具有哪些值超出实际标签长度时感到困惑。例如,假设我有标签 A-Z,索引为 0-26,目标标签是:

# 'H','E','L','L','O'
targ1=[7,4,11,11,14] 

# 'N','O'
targ2=[13,14]

sparse = [ [7,4,11,11,14],
           [13,14,0,0,0] ]

在稀疏中,第二批的实际成绩单显示为NOAAA,尽管它只是NO。所以我想知道TensorFlow在计算损失时如何处理这个问题。这不会让网络学会输出错误的字符序列吗?或者我可以让标签的索引范围在 1 到 27 之间,而不是从 0 到 26,因此强制网络仅输出 1-27 之间的类,但我无法说服自己即使这样也能完美运行。

另外我认为 CTC Loss 的 TensorFlow 手册没有提到空白标签的索引被假定为 N_Classes - 1,我在这里找到了:CTC Loss op。有人可以确认这样的假设是否正确吗?

我请求某人澄清我的疑问。感谢您的时间和支持。

【问题讨论】:

    标签: tensorflow speech-recognition recurrent-neural-network


    【解决方案1】:

    CTC_OPS 来源声明

    inputsTensor 最里面的维度大小,num_classes,代表 num_labels + 1 classes,其中 num_labels 是真实标签的数量,并且 最大值(num_classes - 1)留给空白标签

    【讨论】:

      【解决方案2】:

      我最近研究了语音识别,tensorflow中的SparseTensor表示它会在标签矩阵中添加0,所以0表示no-class,所以我认为blank-label类的索引是0,并且num_classes 是 1-27。

      【讨论】:

        猜你喜欢
        • 2017-04-08
        • 2018-01-16
        • 1970-01-01
        • 2020-12-04
        • 1970-01-01
        • 1970-01-01
        • 1970-01-01
        • 2017-07-23
        • 2018-01-16
        相关资源
        最近更新 更多