【问题标题】:Neural network architecture for author name as an input?作者姓名作为输入的神经网络架构?
【发布时间】:2017-11-24 13:15:07
【问题描述】:

我正在构建一个神经网络来预测一件具有广泛输入(尺寸、艺术媒介等)的艺术品的价值,我也想将作者作为输入(它是通常是一件艺术品价值的重要因素)。

我目前担心的是作者的名字不是 NN 的理想数字输入(即,如果我只是用递增的整数值对每个作者进行编码,我将间接地为列表下方的作者分配更多值 - _-)。我的想法是为我的数据集中的所有作者创建单独的输入,然后只使用一种热编码来更好地表示 NN 的输入。

但是,当我的训练数据中未包含的作者用作 NN 的输入(即新作者)时,这种方法会遇到问题。我可以通过“其他作者”输入字段来解决这个问题,但我担心这会不准确,因为我不会针对这个输入训练 NN(所有具有估价的艺术品都有作者)。

我还没有完全考虑到这一点,但我想也许训练 2 个 NN,一个用于没有作者的评估,一个用于有作者的评估,以确保我有足够的训练数据来进行“无作者评估”相当准确。

在我陷入实施之前,我仍在尝试对最佳 NN 架构进行概念化,因此如果有人有任何建议/cmets,我将非常感激!

提前致谢, 文斯

【问题讨论】:

    标签: architecture neural-network author


    【解决方案1】:

    为避免将作者姓名翻译成可比较的数字,您可以对姓名进行哈希处理,这将创建一个均匀分布。

    【讨论】:

      【解决方案2】:

      尝试使用艺术家姓名的one-hot encoding

      这是categorical feature的示例

      【讨论】:

        猜你喜欢
        • 1970-01-01
        • 2017-06-13
        • 2018-03-03
        • 1970-01-01
        • 2019-10-02
        • 2018-11-25
        • 2012-10-05
        • 1970-01-01
        相关资源
        最近更新 更多