深度卷积学习网络基本原理
一.了解
【1】背景
侧重于检测,遥感分析什么什么的
【2】遥感影像
【3】遥感图像理解
1.自动翻译技术精度低,
2.应用场景多样性,
3.深度学习缺陷(目标检测的攻击和防守,决策过程难以控制)对抗样本等问题
【4】工程应用场景
【5】杰出的应用:
1.2012年的语音识别与图像识别(学习猫的行为)
2. 2012年的微软全自动同声传译系统,关键技术(DNN)也可以叫深度学习
3. 2018年,深度学习不仅仅在工业领域发展迅速,在图灵奖中也获得成绩。
【6】卷积神经网络学习的历史
卷积神经网络基础概念
【1】机器学习
1.存在的问题
1.图像识别
2.语音识别
3.自然语言理解
4.天气预测
5.基因表达
6.内容推荐
2.流程:
获取数据——》预处理——》特征提取——》特征选择——》预测,识别
典型的过程:输入数据,评估函数(函数可以对没有见过的新数据给一个新的评估,构建一个模型)
评估过程问题(评估一辆车,四个轮子,一个车体,但是,四个轮子一个车体不一定是车,所以特征的选取很重要,那么,如何特征选择,是一个很难的问题,我们需要进行一个思考)
3.经典定义:
1.经典定义:利用经验改善系统自身的性能
(经验就是一种特征的筛选,获得的)
4.例子:
2.举例:有一堆瓜,对他的特征收集,判断,选择模型,训练样本,判断是否一个好瓜
损失函数:评估我们当前模型的评估结果,选择合适的参数,减少误差,得到准确的模型
目标函数:最终的模型
首先,一些数据(训练集)
1.数据
画出图发现复合线性模型
2.选择目标函数
3.选择损失函数训练
1.了解特征
2。明白目标
为了让L(w,b)最小
3.求偏导
4.写代码
5.梯度下降算法
由于上述的箭头地方不好理解,数据的多的话就不行,换了另一种算法——梯度下降算法
6.梯度下降算法的代码
问题:超参数难以设置
4.超参数设置
参数的设定会影响误差,参数的变化
1 2可能需要增加迭代次数
也可以改变学习率:
1,就学习率不行
如果数据error变化左右来回,那么学习率太大,如果变化太小,那么就是学习率太小
(我们现在的数据是不符合实际的,是唯一大坑的数据,梯度下降的时候局部最优一次迭代就可以进入整体最优,而有的数据是大波浪线,有小坑,所以可能进入小坑后就判断为最优化,所以学习率选择靠经验很重要)一般为0.001~0.003
5.p次的梯度下降算法
平衡一个样本的不足,考虑了算法的不足
增加参数
6.数据预测
发现损失函数值太大了,过拟合,所以我们的模型不是最优的(梯度下降算法还是目标函数存在的问题),判断发现参数,学习率,迭代次数,损失函数都没有问题(严格按照正常流程进行),所以就是目标函数出现问题,所以模型选择存在问题,把不应该选择线性模型
7.新的目标函数
机器学习不仅可以使用原有特征,还可以根据已有特征进行创造特征,比如男,二十岁,可以创造一个二十岁的男性这一特征,如下,我们不只有x还可以创造出x的次方,三次等等
增加特征以后,那么x的次方哪个最好呢?二次?三次?
8.模型的选择
尽可能选择参数合适,有好拟合的模型
1.过拟合