机器学习基石-Learning to Answer Yes/No

课程大纲

机器学习基石-Learning to Answer Yes/No

Perceptron Hypothesis Set

1.Hypothesis的线性表示

x=(x1,x2,...xd)
y={+1,−1}

h (x) = s i g n ((\sum i = 1 d w i x i) - t h e r s h o l d)

2.Hypothesis的向量表示

h (x) = s i g n (w T x)

3.Hypothesis的图像表示

机器学习基石-Learning to Answer Yes/No

x：平面上的点
y：∘(+1),∗(−1)
hypothesis：平面上的线，不同的w代表不同的线，也代表不同的假设

Perceptron Learning Algorithm

1.算法的目的：从假设空间寻找一个比较好的假设

机器学习基石-Learning to Answer Yes/No

2.算法的流程

机器学习基石-Learning to Answer Yes/No

这里解释一下右图：
我们知道犯错有两种情况

x是正类，错分为负类，即wTx<0,w和x向量夹角是钝角，所以我们需要纠正一下w,也就是w+yx,在w上加上一个正向量，让w离x更近一些.
x是负类，错分为正类,即wTx>0,w和x向量夹角是锐角，所以我们需要纠正一下w,也就是w+yx,在w上加上一个负向量，让w离x更远一些

Guarantee of PLA

如果要保证PLA是收敛的，前提是数据集是线性可分的(Linear Separability)

算法的收敛性

(1)由于训练数据是线性可分的，存在超平面可将训练数据集完全正确分开，取此超平面为ŵ opt⋅x̂ =0,使∥wopt^∥2=1对于训练数据集均有

y i (w ̂ o p t \cdot x i^) > 0

所以存在

γ=mini{yi(ŵ opt⋅xi^)}

使

y i (w ̂ o p t \cdot x i^) \geq γ

(2)

w k^w o p t^= w k - 1^\cdot w o p t^+ y i w o p t^\cdot x i^\geq w k - 1^\cdot w o p t^+ γ = k γ

(3)

因为

y i (w k - 1^\cdot x i^) \leq 0

定义

R = max 1 \leq i \leq N x i^

∥ w k^∥ 2 = ∥ w k - 1^∥ + 2 y i w k - 1^\cdot x i^+ ∥ x i^∥ \leq ∥ w k - 1^∥ + ∥ x i^∥ \leq ∥ w k - 1^∥ + R 2 = k R 2

所以有

k γ \leq w k^w o p t^\leq ∥ w k^∥ \cdot ∥ w o p t^∥ \leq k \sqrt R

k \leq (R γ) 2

说明误分类的次数是有上界的，经过有限次搜索可以找到训练数据完全正确分开的的分离超平面，也就是说，当训练数据线性可分时，感知机学习算法形式迭代是收敛的

相关文章：

猜你喜欢

相关资源

相似解决方案

热门标签

Java Python linux javascript Mysql C# Docker 算法前端 SpringBoot Redis Vue spring 设计模式 .net core .net kubernetes c++ 数据库数据结构大数据 js 机器学习微服务 Android Go 程序员面试 JVM ASP.net core 云原生人工智能后端 PHP git CSS golang k8s Nginx Django mybatis 深度学习多线程 React 架构 devops 爬虫云计算 Spring Boot LeetCode