【发布时间】:2016-09-13 08:10:24
【问题描述】:
我想构建一个神经网络,该网络将根据我创建的数据进行训练。我的问题是这些数据应该有什么形式?换句话说,keras 是否允许将字符串/字符作为输入的神经网络?如果不是,只能接受输入/输出应该在什么范围内的数字?
【问题讨论】:
标签: neural-network theano keras
我想构建一个神经网络,该网络将根据我创建的数据进行训练。我的问题是这些数据应该有什么形式?换句话说,keras 是否允许将字符串/字符作为输入的神经网络?如果不是,只能接受输入/输出应该在什么范围内的数字?
【问题讨论】:
标签: neural-network theano keras
输入数据(即特征)的唯一条件是它应该是数字。范围实际上没有任何限制,但最好使用Feature Scaling、Normalization 等来确保我们的模型不会混淆。神经网络或其他机器学习方法不能直接接受字符串(字符、单词),因此需要先将字符串转换为数字。有很多方法可以做到这一点,最常见的技术包括Bag of Words、tf-idf 特征、word embeddings 等。 以下教程(使用 scikit)可能是一个很好的起点:
【讨论】: