机器学习PYTHON实践

绪论

机器学习，它致力于研究如何通过计算（CPU和GPU计算）的手段，利用经验来改善（计算机）系统自身的性能。
机器学习所研究的主要内容：

在计算机上从数据中产生“模型（model）”算法(学习算法)
数据+机器学习算法=机器学习模型

统计机器学习的方式：
3. 监督学习
4. 无监督学习
5. 强化学习

统计机器学习三要素

统计学习方法由三要素构成：方法=模型+策略+算法
1. 模型
在监督学习中，模型是所要学习的条件概率分布或决策函数。模型的假设空间包含所有可能的条件概率分布或决策函数。参数向量 $θ$ 取值于n维欧式空间 $R^n$ ，称为参数空间，假设空间F通常是由一个参数向量决定的函数族：
机器学习PYTHON实践
假设空间也可以定义为条件概率的集合

2. 策略
损失函数和风险函数
监督学习中需要用一个损失函数（loss function）或代价函数（cost function）来度量预测错误的程度，常用的损失函数有以下几种：
6. 0-1损失函数（0-1 loss function）
机器学习PYTHON实践
7. 平方损失函数（quadratic loss function）
8. 绝对损失函数（absolute loss function）

9. 对数（似然）损失函数（logarithmic loss function）
期望风险
损失函数值越小，模型就越好。由于模型的输入，输出是随机变量，遵循联合分布P(X,Y)，所以损失函数的期望是
机器学习PYTHON实践
理论上f(X)关于联合分布P(X,Y)的平均意义下的损失，称为风险函数（risk function）或期望损失（expected loss）。
经验风险
给定一个训练数据集，模型f(X)关于训练数据集的平均损失称为经验风险（empirical risk）或经验损失（empirical loss）
机器学习PYTHON实践
监督学习的目标就是选择期望风险最小的模型，由于联合分布P(X,Y)是未知的，无法得到真实的期望风险。经验风险是模型关于训练样本集的平均损失，根据大数定理，当样本容量N趋于无穷时，经验风险趋于期望风险。所以一个很自然的想法是用经验风险估计期望风险，但是由于现实中训练样本数目有限，甚至很小，所以用经验风险估计期望风险常常不理想，需要对经验风险进行一定的矫正。
3. 算法
算法是指学习模型的具体计算方法，以求解最优模型。如果最优化问题有显式的解析解，这个最优化问题比较简单，但是通常解析解不存在，这就需要用数值计算的方法求解。如何保证找到全局最优解，并使求解的过程高效，是需要考虑的一个重要问题。

监督学习

在监督学习中，将输入与输出所有可能取值的集合分别称为输入空间与输出空间。输入空间与输出空间可以是无限元素的集合，也可以是整个欧式空间，输入空间与输出空间可以是同一个空间，也可以是不同的空间，但通常输出空间远远小于输入空间。
每个具体的输入就是一个实例，通常有特征向量表示，所有特征向量存在的空间称为特征空间。特征空间的每一维对应一个特征，模型实际上都是定义在特征空间上的。
监督学习从训练数据集合中学习模型，对测试数据进行预测，训练数据由输入与输出对（样本/样本点）组成。输入输出变量可以是连续的，也可以是离散的，根据不同类型建立不同模型，输出变量为连续变量时，预测问题为回归问题；输出变量为离散变量时，预测问题为分类问题；输入与输出均为变量序列的预测问题为标注问题。
机器学习PYTHON实践

无监督学习

在无标记的数据上进行学习，重在发现数据中潜在的结构化信息，寻找数据的新视图。
输入数据没有被标记，也没有确定的结果。样本数据类别未知，需要根据样本间的相似性对样本集进行分类（聚类，clustering）试图使类内差距最小化，类间差距最大化。通俗点将就是实际应用中，不少情况下无法预先知道样本的标签，也就是说没有训练样本对应的类别，因而只能从原先没有样本标签的样本集开始学习分类器设计。
无监督学习的方法分为两大类：
(1)一类为基于概率密度函数估计的直接方法：指设法找到各类别在特征空间的分布参数，再进行分类。
(2)另一类是称为基于样本间相似性度量的简洁聚类方法：其原理是设法定出不同类别的核心或初始内核，然后依据样本与核心之间的相似性度量将样本聚集成不同的类别。
利用聚类结果，可以提取数据集中隐藏信息，对未来数据进行分类和预测。应用于数据挖掘，模式识别，图像处理等。
机器学习PYTHON实践

强化学习

一个能够感知环境的自治智能体(Agent)，如何通过学习来选择能够达到目标的最优动作，即强化学习Agent的要解决的问题就是学习从环境到动作的映射。
机器学习PYTHON实践
强化学习的特征：

Agent不是静止的，被动的等待而是主动的对环境做出试探；
环境对试探动作反馈的信息是评价性的(好或坏)；
Agent在行动-评价的环境中获得知识，改进行动方案以适应环境，达到预期目的。

未完待续！！！

目录

绪论

统计机器学习三要素

监督学习

无监督学习

强化学习