【发布时间】:2021-07-24 00:37:35
【问题描述】:
我正在执行一项 NLP 任务,我在其中分析文档并将其分类为六个类别之一。但是,我在三个不同的时间段执行此操作。所以最终的输出是一个由三个整数组成的数组(稀疏),其中每个整数是 0-5 的类别。所以标签看起来像这样:[1, 4, 5]。
我正在使用 BERT,我正在尝试决定我应该附加什么类型的头,以及我应该使用什么类型的损失函数。使用 BERT 的大小为 1024 的输出并通过具有 18 个神经元的 Dense 层运行它,然后重新整形为大小为 (3,6) 的东西是否有意义?
最后,我假设我会使用稀疏分类交叉熵作为我的损失函数?
【问题讨论】:
-
您为什么以及如何在 3 个不同的时间段内这样做?
-
@GaryOng 我正在使用三个不同的时间段,因为我试图预测 1 个月、6 个月和 1 年的结果。我试图使用同一个 ML 网络来完成这三个任务,而不是为每个时间段构建单独的网络。
标签: python machine-learning nlp bert-language-model