应用机器学习

在第六周课件中，泛化能力 (generalize) 一般指对整个样本的适应性。
还有 high bias 欠拟合，high variance 过拟合。
在应用过程中出现问题,比如：错误率有多高，和别人用相同算法的情况下，一般针对不同情况有以下应对措施：

Get more training examples
Try smaller sets of features
Try getting additional features
Try adding polynomial features
Try decreasing $\lambda$
Try increasing $\lambda$

Diagnostics can take time to implement, but doing so can be a very good use of your time.
就是说进行诊断是对时间最有效的利用。

数据集的分类:

60%训练集（调theta）
20%验证集 (调整正则参数lambda)
20%测试集

error是根据 $J(\theta)$ 进行计算.
模型选择：根据 $J_{test}(\theta)（测试集），J_{cv}(\theta)（验证集）$ ，选择model。线性回归以及逻辑回归。

关于d（d 指 x 的最高幂）

d 很小时，模型不能很好的拟合，故而error 都很大
d 很大时，对训练集过拟合，对测试集不行
故而找到合适的d 来选择模型。
故而要找许多d来测试
如下：
关于lambda
lambda很大欠拟合
lambda很小过拟合
lambda要适中
进行选择的时候，要用一堆lambda进行验证集调参。比如：

error 与 lambda 的走向
关于m（训练集数目）

过拟合走向

欠拟合走向

ps：最后神经网络
小型容易欠拟合，算力要求低
大型容易过拟合，算力要求高

相关文章：

2021-06-30
2021-06-10
2021-12-25
2021-09-01
2021-07-31
2021-12-25

猜你喜欢

2021-07-26
2021-07-24
2021-06-13
2021-06-11
2022-01-18
2021-10-30
2021-10-25

相关资源

下载 2021-06-05
下载 2023-01-24
下载 2023-03-03

相似解决方案

热门标签

Java Python linux javascript Mysql C# Docker 算法前端 SpringBoot Redis Vue spring 设计模式 .net core .net kubernetes c++ 数据库数据结构大数据 js 机器学习微服务 Android Go 程序员面试 JVM ASP.net core 云原生人工智能后端 PHP git CSS golang k8s Nginx Django mybatis 深度学习多线程 React 架构 devops 爬虫云计算 Spring Boot LeetCode