【发布时间】:2020-09-14 01:26:54
【问题描述】:
我一直在尝试使用 TensorFlow v2 keras 训练双向 LSTM 进行文本分类。下面是架构:
model1 = Sequential()
model1.add(Embedding(vocab, 128,input_length=maxlength))
model1.add(Bidirectional(LSTM(32,dropout=0.2,recurrent_dropout=0.2,return_sequences=True)))
model1.add(Bidirectional(LSTM(16,dropout=0.2,recurrent_dropout=0.2,return_sequences=True)))
model1.add(GlobalAveragePooling1D())
model1.add(Dense(5, activation='softmax'))
model1.compile(loss='categorical_crossentropy', optimizer='adam', metrics=['accuracy'])
model1.summary()
现在,我感到困惑的是摘要细节
我的疑惑与 BiLSTM 层的输出形状有关。尽管 2 层使用的单元数分别为 32 和 16,但它们是 (283,64) 和 (283,32)。这里,maxlength=283,vocab=19479
【问题讨论】:
标签: python tensorflow keras neural-network nlp