“机器学习”算法学习总结
本文主要对近期学习的各种算法做一个归档总结
一:k-近邻算法
优点:可以完成很多分类任务
缺点:无法给出数据的内在含义
流程:1.1收集数据
1.2准备数据:从文本文件中解析数据,距离计算所需要的数值,最好采用结构化的数据格式,如归一化数值
1.3分析数据:可以采用Matplotlib创建散点图进行数据分析
1.4训练算法:???
1.5测试算法:计算算法的错误率
1.6使用该算法进行构建
计算方式:给出样本点N个,需要计算点距离N点位置,取最近的m个点,各个答案中有m点最多的就是正确答案