【发布时间】:2021-01-28 05:29:35
【问题描述】:
我有一个包含调查答案的数据框。其中三列是开放式答案。使用 HuggingFace NLP 我正在使用预先训练的情感分析分类器。请在下面找到代码:
from transformers import AutoTokenizer, AutoModelForSequenceClassification, pipeline
model_name = "nlptown/bert-base-multilingual-uncased-sentiment"
model = AutoModelForSequenceClassification.from_pretrained(model_name)
tokenizer = AutoTokenizer.from_pretrained(model_name)
classifier = pipeline('sentiment-analysis', model=model, tokenizer=tokenizer)
classifier("This community is so helpful!")
分类器测试的结果是:"[{'label': '5 stars', 'score': 0.800311}]
我想做的是让分类器在我的开放式响应上运行,并在我的数据框的新列中包含星级和排名分数。
任何帮助将不胜感激。
编辑:我通过本地 csv 上传了数据集。我要使用的数据框列名称是“Q72”
【问题讨论】:
-
这信息太多了。您正在搜索的是如何在列上应用函数并使用结果创建新列。 NLP 不会为这个问题添加任何有用的东西。一旦您以这种方式提出问题,就会有很多现有答案,例如stackoverflow.com/questions/16236684/…
标签: python pandas huggingface-transformers