【发布时间】:2017-04-06 18:21:47
【问题描述】:
我对所有这些数据挖掘、WEKA 工具等都是新手,
在我的学术项目中,我必须处理错误报告。我的 SQL Server 中有它们。我采用了错误摘要属性并应用了标记化、停用词删除和词干提取技术。
摘要中的所有词干都存储在数据库中;分开。现在我必须应用频繁模式挖掘算法,并使用WEKA工具找出频繁项集。我有这样的 arff 文件。
@relation ItemSets
@attribute bugid integer
@attribute summary string
@data
755113,enhanc;keep;log;recommend;share
759414,access;review;social
763806,allow;intrus;less;provid;shrunken;sidebar;social;specifi
767221,datacloneerror;deeper;dig;framework;jsm
771353,document;integr;provid;secur;social
785540,avail;determin;featur;method;provid;social;whether
785591,chat;dock;horizont;nest;overlap;scrollbar
787767,abus;api;implement;perform;runtim;warn;worker
在 Weka 中打开它后,在 WEKA Explorer 的 Associate 选项卡下,我无法在选择 Apriori 的情况下启动进程(开始按钮已禁用)。
现在请建议我如何使用 WEKA 在摘要属性上查找频繁项集。我需要认真的帮助。帮助将不胜感激。提前致谢!
【问题讨论】:
标签: weka text-mining apriori