weka 的使用
环境:
- ubuntu 16.04
目录
- weka的简介
- weka的安装
- 使用
1. weka的简介
- weka是新西兰的一种鸡,差不多长这样:
- 也是一款基于java的数据挖掘(data mining)、机器学习(machine learning)常用软件,是开源的,非商业化的。
- weka学习视频在怀卡托大学网站Weka MOOC和优酷上可以找到,Youtube上也有嗷,有人把视频也搬到了b站(bilibili)。
-
weka的官网:https://www.cs.waikato.ac.nz/ml/weka/
Weka 3: Machine Learning Software in Java
Weka is a collection of machine learning algorithms for data mining tasks. It contains tools for data preparation, classification, regression, clustering, association rules mining, and visualization.
Found only on the islands of New Zealand, the Weka is a flightless bird with an inquisitive nature. The name is pronounced like this, and the bird sounds like this.
Weka is open source software issued under the GNU General Public License.
We have put together several free online courses that teach machine learning and data mining using Weka. The videos for the courses are available on Youtube.
Weka supports deep learning!
2. weka的安装
- 在终端使用apt-get安装可以,命令为:
sudo apt-get install weka - 使用时键入
weka
页面可以打开: - 也可以到官网按照引导下载,选择自己对应的操作系统:https://www.cs.waikato.ac.nz/ml/weka/downloading.html
3. weka的使用
-
以weka 自带的数据集为例,自带的数据集可以在这个目录下找到:
-
在weka中点击
explore->open file,打开.arff文件。 -
下边
Filter可以选择过滤掉其中的一些信息,分为有监督学习和无监督学习的属性过滤(attribute)或样本过滤(instance)。 -
进行分类训练,点击左上方
Classify标签,然后点击Choose选择一个分类器,设置其他可选的参数,点击中间左侧的Start即可开始进行分类任务,结果输出在Classifier output框里。例如:- 选择好分类器后双击分类器名字那一栏(页面顶部
Choose后面)可以打开分类器的设置,比如: - 运行完后左下角会有一个执行记录,是时间+分类器名称。右键它可以进行更多选择,比如可视化,
visualize tree什么的:
- 选择好分类器后双击分类器名字那一栏(页面顶部
-
其他功能比如聚类、关联关系分析、可视化等,都在页面第一行。
0. 碎碎念
- 今日疑惑:为什么老师可以边喝酒边吃东西边讲课,还很自然(见wekamooc视频的1.6节)。
- 基础很重要!算法的内涵还是要提前学习嗷,基础打好总没错。这样的话实践起来就方便一些,也可以理解更深一点。如果提前不了解那些数据存储语法、各种分类算法、聚类算法、关联规则挖掘算法的话,使用软件时会一头雾水。