一眼看穿：机器基本概念、五大流派与九种常见算法本质

大家好，都十二月份，陪着大家在今年又走过数月了，相信关注我们平台的用户，大多用户对这个行业有着浓厚的兴趣。有人一定会说这个行业，工资高是兴趣的本质。其实小编也是相同的想法

小编更想说，钱多合适我，机器学习行业在内心中比较适合我，唯独是技术更不上。

一眼看穿：机器基本概念、五大流派与九种常见算法本质

我们还是言归正传。

一机器学习基本概览

一眼看穿：机器基本概念、五大流派与九种常见算法本质

之前的文章中已经提到过多次机器学习概念性问题。小编再次也唠叨一下。

什么是机器学习？

机器学习(Machine Learning, ML)是一门多领域交叉学科，涉及概率论、统计学、逼近论、凸分析、算法复杂度理论等多门学科。专门研究计算机怎样模拟或实现人类的学习行为，以获取新的知识或技能，重新组织已有的知识结构使之不断改善自身的性能。

上面的那段话是官方术语。机器说到底机器学习，就是算法学习，把算法转化成为机器懂得语言。

机器学习和人工智能关系如图：

一眼看穿：机器基本概念、五大流派与九种常见算法本质

3. 机器学习正确工作方式

①选择数据：将你的数据分成三组：训练数据、验证数据和测试数据

②模型数据：使用训练数据来构建使用相关特征的模型

③验证模型：使用你的验证数据接入你的模型

④测试模型：使用你的测试数据检查被验证的模型的表现

⑤使用模型：使用完全训练好的模型在新数据上做预测

⑥调优模型：使用更多数据、不同的特征或调整过的参数来提升算法的性能表现

一眼看穿：机器基本概念、五大流派与九种常见算法本质

1. 五大流派

①符号主义：使用符号、规则和逻辑来表征知识和进行逻辑推理，最喜欢的算法是：规则和决策树

②贝叶斯派：获取发生的可能性来进行概率推理，最喜欢的算法是：朴素贝叶斯或马尔可夫

③联结主义：使用概率矩阵和加权神经元来动态地识别和归纳模式，最喜欢的算法是：神经网络

④进化主义：生成变化，然后为特定目标获取其中最优的，最喜欢的算法是：遗传算法

⑤Analogizer：根据约束条件来优化函数（尽可能走到更高，但同时不要离开道路），最喜欢的算法是：支持向量机

九种常见算法本质

1. 卷积神经网络（convolutional neural network）：卷积是指来自后续层的权重的融合，可用于标记输出层。

2. 循环神经网络（Recurrent neural network）：在任意神经网络中，每个神经元都通过 1 个或多个隐藏层来将很多输入转换成单个输出。循环神经网络（RNN）会将值进一步逐层传递，让逐层学习成为可能。换句话说，RNN 存在某种形式的记忆，允许先前的输出去影响后面的输入。

一眼看穿：机器基本概念、五大流派与九种常见算法本质

3. 隐马尔可夫模型

4. 朴素贝叶斯分类

5. 回归（Regression）：回归可以勾画出因变量与一个或多个因变量之间的状态关系。在这个例子中，将垃圾邮件和非垃圾邮件进行了区分。

一眼看穿：机器基本概念、五大流派与九种常见算法本质

6.支持向量机（Support Vector Machine）：基于超平面（hyperplane），支持向量机可以对数据群进行分类

7. 决策树（Decision Tree）：在进行逐步应答过程中，典型的决策树分析会使用分层变量或决策节点，例如，可将一个给定用户分类成信用可靠或不可靠。

8. 随机森林（Random forest）：随机森林算法通过使用多个带有随机选取的数据子集的树（tree）改善了决策树的精确性。本例在基因表达层面上考察了大量与乳腺癌复发相关的基因，并计算出复发风险。

一眼看穿：机器基本概念、五大流派与九种常见算法本质

8. 长短期记忆（Long short-term memory，LSTM）与门控循环单元神经网络（gated recurrent unit nerual network）：早期的 RNN 形式是会存在损耗的。尽管这些早期循环神经网络只允许留存少量的早期信息，新近的长短期记忆（LSTM）与门控循环单元（GRU）神经网络都有长期与短期的记忆。换句话说，这些新近的 RNN 拥有更好的控制记忆的能力，允许保留早先的值或是当有必要处理很多系列步骤时重置这些值，这避免了「梯度衰减」或逐层传递的值的最终 degradation。LSTM 与 GRU 网络使得我们可以使用被称为「门（gate）」的记忆模块或结构来控制记忆，这种门可以在合适的时候传递或重置值。

一眼看穿：机器基本概念、五大流派与九种常见算法本质

大家是不是看累了，小编刚好讲完。

一眼看穿：机器基本概念、五大流派与九种常见算法本质