【发布时间】:2017-11-24 13:15:07
【问题描述】:
我正在构建一个神经网络来预测一件具有广泛输入(尺寸、艺术媒介等)的艺术品的价值,我也想将作者作为输入(它是通常是一件艺术品价值的重要因素)。
我目前担心的是作者的名字不是 NN 的理想数字输入(即,如果我只是用递增的整数值对每个作者进行编码,我将间接地为列表下方的作者分配更多值 - _-)。我的想法是为我的数据集中的所有作者创建单独的输入,然后只使用一种热编码来更好地表示 NN 的输入。
但是,当我的训练数据中未包含的作者用作 NN 的输入(即新作者)时,这种方法会遇到问题。我可以通过“其他作者”输入字段来解决这个问题,但我担心这会不准确,因为我不会针对这个输入训练 NN(所有具有估价的艺术品都有作者)。
我还没有完全考虑到这一点,但我想也许训练 2 个 NN,一个用于没有作者的评估,一个用于有作者的评估,以确保我有足够的训练数据来进行“无作者评估”相当准确。
在我陷入实施之前,我仍在尝试对最佳 NN 架构进行概念化,因此如果有人有任何建议/cmets,我将非常感激!
提前致谢, 文斯
【问题讨论】:
标签: architecture neural-network author