【发布时间】:2016-08-21 19:47:53
【问题描述】:
我正在通过卷积神经网络进行文本分类。在示例MNIST 中,他们有 60.000 个手写数字示例,每个图像的大小为 28 x 28,并且有 10 个标签(从 0 到 9)。所以重量的大小将是 784 * 10 (28 * 28 = 784)
这是他们的代码:
x = tf.placeholder("float", [None, 784])
W = tf.Variable(tf.zeros([784,10]))
b = tf.Variable(tf.zeros([10]))
就我而言,我应用了word2vec 来对我的文档进行编码。 word embedding的结果“dictionary size”是2000,embedding size是128。有45个标签。我尝试做与示例相同的操作,但没有成功。这是我所做的:我将每个文档都视为图像。例如,该文档可以表示为 2000 x 128 的矩阵(对于出现在文档中的单词,我为该列附加了单词 Vector 值,而其他值为零。我在创建 W 和 x 时遇到了麻烦,因为我的输入数据是一个 2000 x 128 的 numpy 数组,而 x = tf.placeholder("float", [None, 256000])。大小不匹配。
有人可以提出任何建议吗?
谢谢
【问题讨论】:
标签: python tensorflow word2vec