【问题标题】:How to use NER model fine tuned using hugging face transformers with spark nlp on databricks如何在 databricks 上使用带有 spark nlp 的拥抱面变压器使用 NER 模型进行微调
【发布时间】:2021-12-11 17:34:23
【问题描述】:

我需要训练(微调)NER 标记分类器来识别我们的自定义标记。 我发现最简单的方法是: Token Classification with W-NUT Emerging Entities

但现在我遇到了一个问题 - 计划如下: HuggingFace in Spark NLP - BERT Sentence.ipynb , 但是当我尝试时:

model.save_pretrained(<path on DBFS>)

我收到文件写入错误。据我了解,这是因为 transformers/keras 无法在 DBFS 等分布式文件系统上运行

有什么办法可以解决这个问题吗?

我无法将训练从数据块中移开,因为我正在使用数据库中的数据(实体)来创建训练文件

PS。也许我可以只使用 spark nlp 做同样的事情?最好使用相同的“仅标签”格式?

【问题讨论】:

    标签: apache-spark nlp databricks huggingface-transformers johnsnowlabs-spark-nlp


    【解决方案1】:

    您应该先将模型保存到本地文件系统,然后将其复制到 DBFS:

    from distutils.dir_util import copy_tree
    
    local_path = "./tmp/model"
    dbfs_path = "/dbfs/tmp/model"
    
    model.save_pretrained(local_path)
    copy_tree(local_path, dbfs_path)
    

    【讨论】:

      猜你喜欢
      • 2021-12-12
      • 2021-08-16
      • 2022-08-20
      • 2021-02-16
      • 2020-10-12
      • 2021-12-30
      • 2020-07-05
      • 2021-01-26
      • 1970-01-01
      相关资源
      最近更新 更多