作者姓名作为输入的神经网络架构？答案

【问题标题】：Neural network architecture for author name as an input?作者姓名作为输入的神经网络架构？
【发布时间】：2017-11-24 13:15:07
【问题描述】：

我正在构建一个神经网络来预测一件具有广泛输入（尺寸、艺术媒介等）的艺术品的价值，我也想将作者作为输入（它是通常是一件艺术品价值的重要因素）。

我目前担心的是作者的名字不是 NN 的理想数字输入（即，如果我只是用递增的整数值对每个作者进行编码，我将间接地为列表下方的作者分配更多值 - _-)。我的想法是为我的数据集中的所有作者创建单独的输入，然后只使用一种热编码来更好地表示 NN 的输入。

但是，当我的训练数据中未包含的作者用作 NN 的输入（即新作者）时，这种方法会遇到问题。我可以通过“其他作者”输入字段来解决这个问题，但我担心这会不准确，因为我不会针对这个输入训练 NN（所有具有估价的艺术品都有作者）。

我还没有完全考虑到这一点，但我想也许训练 2 个 NN，一个用于没有作者的评估，一个用于有作者的评估，以确保我有足够的训练数据来进行“无作者评估”相当准确。

在我陷入实施之前，我仍在尝试对最佳 NN 架构进行概念化，因此如果有人有任何建议/cmets，我将非常感激！

提前致谢，文斯

【问题讨论】：

【解决方案1】：

为避免将作者姓名翻译成可比较的数字，您可以对姓名进行哈希处理，这将创建一个均匀分布。

【讨论】：

【解决方案2】：

尝试使用艺术家姓名的one-hot encoding。

【讨论】：