weka主界面如下:
1.Program(编排)菜单
(1)LogWindow(日志窗口):打开一个记录输出到stdout或stderr内容的日志窗口。windows环境下,如果以不带控制台输出的方式启动,日志窗口比较游泳。
(2)Memory usage(内存使用情况):打开一个显示内存使用情况的窗口,如果用户发现内存占用过大,可单击窗口右边的GC按钮,启动垃圾回收器。
(3)Exit(退出):关闭WeKa
2.Visualization(可视化)菜单
(1)Plot(散点图):画出数据集的二维散点图;
(2)ROC:打开与先保存的文件以显示ROC曲线;
(3)TreeVisualizer(树可视化):打开预先保存的文件以显示一个有向图,例如,决策树;
(4)GraphVisualizer(图可视化):显示XML、BIF或DOT格式的图片,例如,贝叶斯网络;
(5)BoundaryVisualizer(边界可视化):允许在二维空间中对分类器的决策边界进行可视化。
3.Tools(工具)菜单
(1)Package manager(包管理器):允许用户选择安装感兴趣或需要的算法软件包;
(2)ArffViewer(ARFF查看器):一个MDI应用程序,使用电子表格的形式来查看ARFF文件;
(3)SqlViewer(SQL查看器):通过JDBC(java数据库连接)查询数据库的简单窗口,支持连接数据库,执行SQL语句,并显示结果。
(4)Bayes net editor(贝叶斯网络编辑器):一个编辑、可视化和学习贝叶斯网络的应用程序。
4.Help(帮助)菜单
(1)Weka homepage(weka主页):打开一个浏览器窗口,显示weka主页。
(2)HOWTOs,code,snippets,etc(基本知识,代码段等):打开常用的WekaWiki,其中含有大量的示例,以及开发和使用Weka的基本知识。
(3)Weka on Sourceforge(Sourceforge 网站的Weka):打开Weka项目在Sourceforge.net网站上的主页。
(4)SystemInfo(系统信息):列出一些关于Java和Weka的环境信息。
5.常见问题
(1)使用utf-8数据集或文件
在Weka安装目录下,找到RunWeka.ini文件将其第32行的fileEncoding=Cp1252中Cp1252改为utf-8。如果没有这一行,找到java/javaw命令,在这些命令行中添加-Dfile.encoding=utf-8参数
(2)OutOfMemoryException(内存不足例外)
java虚拟机分配的内存不够,可以用
java -Xmx512m
进行设置java堆的大小为512MB,也可以用Xmx2g将其设置为2G。
(3)StackOverflowError(栈溢出错误)
java -Xss512k
(4)training and test set are not compatible(训练集和测试集不兼容)
训练集和测试集要求数据结构一致。