【问题标题】:Tensorflow embedding_lookupTensorFlow embedding_lookup
【发布时间】:2016-05-19 14:58:02
【问题描述】:

我正在尝试通过 TensorFlow tf.nn.embedding_lookup() 函数“从头开始”学习 imdb 数据集的单词表示。如果我理解正确,我必须在另一个隐藏层之前设置一个嵌入层,然后当我执行梯度下降时,该层将“学习”该层权重中的单词表示。但是,当我尝试这样做时,我的嵌入层和网络的第一个全连接层之间出现了形状错误。

def multilayer_perceptron(_X, _weights, _biases):
    with tf.device('/cpu:0'), tf.name_scope("embedding"):
        W = tf.Variable(tf.random_uniform([vocab_size, embedding_size], -1.0, 1.0),name="W")
        embedding_layer = tf.nn.embedding_lookup(W, _X)    
    layer_1 = tf.nn.sigmoid(tf.add(tf.matmul(embedding_layer, _weights['h1']), _biases['b1'])) 
    layer_2 = tf.nn.sigmoid(tf.add(tf.matmul(layer_1, _weights['h2']), _biases['b2'])) 
    return tf.matmul(layer_2, weights['out']) + biases['out']

x = tf.placeholder(tf.int32, [None, n_input])
y = tf.placeholder(tf.float32, [None, n_classes])

pred = multilayer_perceptron(x, weights, biases)
cost = tf.reduce_mean(tf.nn.softmax_cross_entropy_with_logits(pred,y))
train_step = tf.train.GradientDescentOptimizer(0.3).minimize(cost)

init = tf.initialize_all_variables()

我得到的错误是:

ValueError: Shapes TensorShape([Dimension(None), Dimension(300), Dimension(128)])
and TensorShape([Dimension(None), Dimension(None)]) must have the same rank

【问题讨论】:

    标签: python python-2.7 machine-learning tensorflow word-embedding


    【解决方案1】:

    形状错误的出现是因为您使用二维张量x 来索引二维嵌入张量W。将tf.nn.embedding_lookup()(及其近亲tf.gather())想象成将x 中的每个整数值i 替换为W[i, :] 行。从错误消息中,可以推断出n_input = 300embedding_size = 128。一般来说,tf.nn.embedding_lookup() 的结果等于rank(x) + rank(W) - 1… 在这种情况下,3。当您尝试将此结果乘以_weights['h1'] 时会出现错误,_weights['h1'] 是一个(二维)矩阵。

    要修复此代码,这取决于您要尝试做什么,以及为什么要将输入矩阵传递给嵌入。一种常见的做法是使用tf.reduce_sum() 之类的操作将每个输入示例的嵌入向量聚合到每个示例的一行中。例如,您可能会执行以下操作:

    W = tf.Variable(
        tf.random_uniform([vocab_size, embedding_size], -1.0, 1.0) ,name="W")
    embedding_layer = tf.nn.embedding_lookup(W, _X)
    
    # Reduce along dimension 1 (`n_input`) to get a single vector (row)
    # per input example.
    embedding_aggregated = tf.reduce_sum(embedding_layer, [1])
    
    layer_1 = tf.nn.sigmoid(tf.add(tf.matmul(
        embedding_aggregated, _weights['h1']), _biases['b1'])) 
    

    【讨论】:

    • 谢谢!我认为 tf.nn.reduce_sum 应该是 tf.reduce_sum ?当你选择降低嵌入层的维度时,你是如何在“n_input=300”和“embedding_size=128”之间选择要降低的?
    • 你的错字是对的——在上面更正了,谢谢!我选择沿n_input 维度减少,因为这似乎更有可能与您的问题相匹配,并且我认为(例如)输入的顺序并不重要。对于词袋类型的问题,这样做是相当典型的。您可以减少embedding_size,但我认为这会丢失嵌入中的大量信息,因此它可能无法正常工作。
    【解决方案2】:

    另一种可能的解决方案是:不添加嵌入向量,而是将这些向量连接成一个向量,并增加隐藏层中的神经元数量。
    我用过:
    embedding_aggregated = tf.reshape(embedding_layer, [-1, embedding_size * sequence_length])
    另外,我将隐藏层中的神经元数量更改为embedding_size * sequence_length。 观察:使用串联而不是加法也提高了准确性。

    【讨论】:

      猜你喜欢
      • 2018-06-18
      • 1970-01-01
      • 1970-01-01
      • 2021-04-07
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      • 2017-02-05
      • 1970-01-01
      相关资源
      最近更新 更多