【发布时间】:2019-11-24 22:44:37
【问题描述】:
我有一个非常不平衡的情绪分类数据集。 https://cl.awaisathar.com/citation-sentiment-corpus/
- 积极类:829
- 否定类:280
- 中性类:7627
这是我的网络:
Sentiment_LSTM(
(embedding): Embedding(5491, 400)
(lstm): LSTM(400, 512, num_layers=2, batch_first=True, dropout=0.5)
(dropout): Dropout(p=0.5, inplace=False)
(fc): Linear(in_features=512, out_features=3, bias=True)
(sig): Sigmoid()
)
损失函数:
lr=0.001
criterion = nn.BCELoss()
optimizer = torch.optim.Adam(net.parameters(), lr=lr)
我在小班上的准确率很低。我该如何进一步改进它?
【问题讨论】:
-
你能写几句关于数据集的事吗?小班是什么意思?
-
@Jindřich 积极类:829 消极类:280 中性类:7627。这是班级分布。现在,当我在测试数据集上测试我的网络时。大部分准确度由 Neutral 类控制。小类(pos 和 neg)不太准确。
标签: nlp pytorch lstm sentiment-analysis