【发布时间】:2020-10-23 21:50:55
【问题描述】:
0
我正在使用 BERT Word Embeddings 进行具有 3 个标签的句子分类任务。我正在使用 Google Colab 进行编码。我的问题是,由于每次重新启动内核时都必须执行嵌入部分,有没有办法在生成这些词嵌入后保存它们?因为,生成这些嵌入需要很长时间。
我用来生成 BERT Word Embeddings 的代码是 -
[get_features(text_list[i]) for text_list[i] in text_list]
这里,gen_features 是一个函数,它为我的列表 text_list 中的每个 i 返回词嵌入。
我读到将嵌入转换为颠簸张量,然后使用 np.save 可以做到这一点。但我其实不知道怎么写代码。
请帮忙。
【问题讨论】:
标签: python-3.x keras nlp word-embedding bert-language-model