【发布时间】:2020-08-31 12:21:42
【问题描述】:
我在一个传统的公司环境中工作,我只有 16 核 64GB 虚拟机可用于 NLP 项目。我有一个多标签 NLP 文本分类问题,我真的很想利用 BERT、RoBERTa、ALBERT 等深度表示学习模型。
我有大约 200,000 个文档需要标记,并且我已经注释了大约 2,000 个文档,用作训练/测试/微调的基本事实。我还有大量与领域相关的文档可用于预训练。我很可能需要从头开始进行预训练,因为这是在临床领域。如果预训练模型有机会使用 Hugging Face 等进行微调,我也对他们持开放态度。
人们会建议以哪些模型及其与 PyTorch 或 Keras 兼容的实现作为起点?或者这是我现有的计算资源无法计算的?
【问题讨论】:
-
试试 ELECTRA,与标准 BERT 模型相比,它已被证明具有更高的计算/数据效率:openreview.net/forum?id=r1xMH1BtvB
标签: keras deep-learning nlp pytorch multilabel-classification