林轩田机器学习基石心得6：Theory of Generalization

0. 前言

该文章是本人观看视频后的一些心得，系统笔记请前往：
http://blog.csdn.net/red_stone1/article/details/71122928

1. Restriction of Break Point

影响成长函数mH(N)的两个因素：
- 样本数量N
- break pointk

2. Bounding Function: Basic Cases

上界函数bounding functionB(N,k)：Bound Function指的是当break point为k的时候，成长函数mH(N)可能的最大值。
上界函数的引入不考虑是1D postive intrervals问题还是2D perceptrons问题，而只关心成长函数的上界是多少，从而简化了问题的复杂度。
我们只需要证明上界函数是多项式时间可求的，那么就能证明成长函数也是多项式时间可求的。
B(N,k)矩阵：
- 当k=1时，B(N,1)恒为1。
- 当N < k时，根据break point的定义，很容易得到B(N,k)=2N。
- 当N = k时，此时N是第一次出现不能被shatter的值，所以最多只能有2N−1个dichotomies，则B(N,k)=2N−1。

shatter：是指在该样本数时，无法用假设函数模拟出所有情况（即mH(N)≠2N)

3. Bounding Function: Inductive Cases

对于2D perceptrons，break point为k=4,mH(N)的上界是Nk−1。广一下，也就是说，如果能找到一个模型的break point，且是有限大的，那么就能推断出其成长函数mH(N)有界。
B(N,K)中N大于k的部分：

4. A Pictorial Proof

Vapnik-Chervonenkis(VC) bound：（证明可看视频。）
对于2D perceptrons，它的break point是4，那么成长函数mH(N)=O(N3)。因此证明成长函数有界—–>样本足够大则Eout(x)≈Ein(X)。

总结

证明了只要存在break point，那么成长函数就是多项式时间内可求的，即机器学习就是可求的。本章节进行了一些推导。

相关文章：

猜你喜欢

相关资源

相似解决方案

热门标签

Java Python linux javascript Mysql C# Docker 算法前端 SpringBoot Redis Vue spring 设计模式 .net core .net kubernetes c++ 数据库数据结构大数据 js 机器学习微服务 Android Go 程序员面试 JVM ASP.net core 云原生人工智能后端 PHP git CSS golang k8s Nginx Django mybatis 深度学习多线程 React 架构 devops 爬虫云计算 Spring Boot LeetCode