四月小结
机器学习基础理论学习
现在大三,之前没有过什么能拿得出手的项目,一度为此愁得不行。在四月得到一些指点,明确以后如果要走机器学习、数据挖掘方面的职业路线,就还是打好理论知识的基础先。项目的话,我打算尽量挤时间完整地完成一个自己构思地机器学习项目,最好能做得完整。
目前四月理论知识已自行整理学习涵盖:
监督学习理论:决策树基础+随机森林、感知机、朴素贝叶斯、KNN
无监督学习理论:聚类方法-K-means、降维方法-主成分分析(总体主成分分析)
数字仿真课设
数字仿真课设要求使用anylogic实现 行人及车辆的交通信号灯控制。基本上来说就是用强化学习的思想去训练一个交通信号灯模型,使得交通拥挤的情况尽可能减少。
四月基本上是处于一个理论学习的状态,目前学习了:
Policy-Gradient\DQN\Actor-Critic
截止5.1,基本实现了基于DQN的模型,还没怎么跑过训练,不过与老师讨论后又说可以了解一下多Agent的RL。有点小晕,不过我也打算看看主流的交通模型是怎么处理的,应该五月前半个月会用来学习这个什么多agent以及训练已经写好的模型,后半个月就再看情况实现多agent。
大数据
这学期开的课我还都挺喜欢的(除了编译原理),像大数据、数字仿真这些理论与项目结合的课程我还是比较中意的!四月份末才开的课,基本上是了解大数据概况吧,以及简单安装和跑了一下hadoop。不过打算看看认真规划一下,买了本书打算跑几个项目学一下怎么跟机器学习结合使用嘿嘿。
目前学习了:Mapreduce原理及上手实现。
常规算法
这方面可太薄弱了,每天会努力保持3道leetcode。加油加油!
反思
四月学习的有些紧张,通过学习发现有些先导课程知识没学好。比如推导主成分分析涉及到一些矩阵特征值blabla的,有些线代的知识给忘了,要抓紧重新捡起来!决策树方面其实只是学了非常基础的东西,发现还有关于Boosting、GBDT、Xgboost、LightGBM这些没涉猎,要逐渐安排起来哈!
而且发现通过博客记录学习固然不错,但要把这些基础理论都记录上去可太耗时了,所以决定博客用于记录项目,以及一些理论的注意要点。最近在跟着课本推导公式的时候总觉得发明这些的人可真够强的,不时也有豁然开朗的舒畅感,数学还是得好好学。
机器学习理论要学的东西有好多,所幸感觉还挺有意思的,五月也继续加油吧。