【问题标题】:Text sequence to integer with many integer classes in KerasKeras中具有许多整数类的文本序列到整数
【发布时间】:2019-05-01 04:38:00
【问题描述】:

我得到了字符串 ex。 “一百二十三”或“九百九十九”,并使用 Keras 文本预处理标记器将其编码为长度为 4 的单词标记序列,并将其用作具有 4 个节点的输入,并有许多整数类作为我的输出前。 0 1 2 ... 1000,带有 1001 个输出节点,带有 tensorflow 后端。

我使用嵌入输入层,然后是展平层,然后是具有 softmax 激活的密集输出层,以将输入序列分类为一个数字。

这种方法适用于从 0 到 1000 等的数字,但使用诸如“八万七千四百二十三”之类的字符串扩展至 100,000 个数字被证明是一个问题,因为有 100,000 个输出神经元,因此训练时间很长。

有没有更好的方法在不牺牲效率的情况下为可能数百万个数字构建 NN?

【问题讨论】:

    标签: python tensorflow machine-learning keras neural-network


    【解决方案1】:

    也许您可以将其表述为使用 RNN 的序列预测问题或具有 N 位输出节点的回归问题。

    【讨论】:

    • 我最初尝试过这样的事情,但没有成功。我会再试一次并报告
    • 最初制作 NN 时,我将文本序列作为输入,另一个序列包含输出数字的数字。它没有成功,因为损失从未完全收敛,准确性也不是很好。这一次,我将输出设为一个包含 10 列和 N 行的数组,其中 N 是输出数的最大位数。输出层具有 softmax 激活,因此行中的最高数字具有预测数字的索引。这种方法最终对数十亿的数字非常有效
    猜你喜欢
    • 2016-09-05
    • 1970-01-01
    • 2014-11-15
    • 1970-01-01
    • 2019-12-28
    • 1970-01-01
    • 2012-07-15
    • 2015-04-08
    • 2015-11-18
    相关资源
    最近更新 更多