【发布时间】:2016-07-16 18:38:51
【问题描述】:
我在理解标签 SparseTensor 应该具有哪些值超出实际标签长度时感到困惑。例如,假设我有标签 A-Z,索引为 0-26,目标标签是:
# 'H','E','L','L','O'
targ1=[7,4,11,11,14]
# 'N','O'
targ2=[13,14]
sparse = [ [7,4,11,11,14],
[13,14,0,0,0] ]
在稀疏中,第二批的实际成绩单显示为NOAAA,尽管它只是NO。所以我想知道TensorFlow在计算损失时如何处理这个问题。这不会让网络学会输出错误的字符序列吗?或者我可以让标签的索引范围在 1 到 27 之间,而不是从 0 到 26,因此强制网络仅输出 1-27 之间的类,但我无法说服自己即使这样也能完美运行。
另外我认为 CTC Loss 的 TensorFlow 手册没有提到空白标签的索引被假定为 N_Classes - 1,我在这里找到了:CTC Loss op。有人可以确认这样的假设是否正确吗?
我请求某人澄清我的疑问。感谢您的时间和支持。
【问题讨论】:
标签: tensorflow speech-recognition recurrent-neural-network