【发布时间】:2019-03-09 14:12:15
【问题描述】:
我正在尝试按照here 的说明创建一个多类文本分类器。但是,我的代码正在中断:
NB_pipeline.fit(X_train, train[category])
以下是我得到的错误:
File "pandas\hashtable.pyx", line 683, in pandas.hashtable.PyObjectHashTable.get_item (pandas\hashtable.c:12322)
我试图找出 train[category] 返回的内容,但我得到了同样的错误。
1) X_train 是一个 dataframe,只有一列,包含客户反馈。
2) train 是一个有两列的dataframe;第一列包含客户评论(与X_train 相同),第二列包含 5 个类别之一(Systems Error, Proactive Communication, Staff Behaviour, Website Functionalities, Others)。
3) category 是上述类别之一。
下面是样本火车dataframe:
Index Feedback Category
0 While making payment got system error. System error
Staff behaviour was good at hotel
1 While making payment got system error. Staff Behaviour
Staff behaviour was good at hotel
【问题讨论】:
-
您能否包括更多的堆栈跟踪,并在问题中包括最少的代码。它应该是独立的和可复制的,无需遵循单独的网站。但删除与问题无关的任何内容(但仍然可以重现)。
标签: python text-classification multiclass-classification