【发布时间】:2018-12-21 18:48:13
【问题描述】:
我在 Weka 3.8 中打开了一个 csv 文件并选择了一个属性/列(下图)。标签由竖线字符分隔。应该有 23 个不同的标签,但 Weka 显示 914。因此,Weka 无法可视化太多的值。动作是一个标签,冒险是另一个标签,等等。基本上每行可以有多个标签。
对于处理(例如分类),如何分离这些值以便 Weka 可以读取它们?
这个问题类似于this。但问题询问日期属性(例如“dd-MM-yyyy HH:mm”)。这询问一个字符分隔的值(例如“动作|冒险|戏剧”)
编辑: 数据取自kaggle。
【问题讨论】: