机器学习--感知机

感知机：二类分类的线性模型，对应于输入空间将实例划分为正负两类的分离超平面，属于判别模型。其基本思想，基于误分类的损失函数，利用梯度下降法对损失函数极小化，求得感知机模型。

1.感知机模型perceptron

输入空间X,输出空间Y={-1,+1} x为实例的特征向量，感知机：

机器学习--感知机

w为权重向量 b为偏置，sign为符号函数：

机器学习--感知机

感知机的假设空间：

机器学习--感知机

2.感知机学习策略

数据集的线性可分性：

给定数据集：

机器学习--感知机 y={-1,+1}

若存在某个超平面S,使得数据集的正负实例点完全正确的划分到超平面两侧，则称数据集T线性可分：

机器学习--感知机

感知机学习策略：

策略：误分类点到超平面的总距离

空间中某一点xo到超平面wx+b=0距离的计算：

机器学习--感知机

过x0做超平面的垂线，相交于点x，点x在超平面上有：

机器学习--感知机

假设点x0到超平面的距离为r,则

机器学习--感知机

代入得：

机器学习--感知机

对于误分类的数据点（xi,yi）:

yi=-1, w*xi+b>0

yi=1, w*xi+b<0

结合有：

机器学习--感知机

误分类点(xi,yi)到超平面的距离：

机器学习--感知机

假设超平面S划分的误分类点结合为M,则所有误分类点到超平面的总距离：

机器学习--感知机

||w||为超平面法方向的长度，可以采用中心化使得||w||=1

即感知机的损失函数定义为：

机器学习--感知机

L(w,b)是w，b连续可导函数。

3.感知机学习算法

感知机优化的目标函数：

机器学习--感知机

采用随机梯度下降，任意选取一个超平面w0,b0,一次随机选取一个误分类点使其梯度下降：

损失函数L(w,b)的梯度：

机器学习--感知机

随机选择一个误分类点（xi,yi）对于权重系数更新：

机器学习--感知机

其中机器学习--感知机为学习率，学习步长。

感知机学习算法原始形式：

1.选取初值w0,b0

2.在训练集中选取数据（xi,yi）

3.如果yi(wxi+b)<=0(说明分类错误)

w<---w+ 机器学习--感知机 yixi

b<---b+ 机器学习--感知机 yi

4.转至2，直到训练集中没有误分类点

最终输出感知机模型 f(x)=sign(wx+b)

对于线性可分数据集感知机学习算法原始形式收敛证明：

机器学习--感知机

误分类次数k有上界，经过有限次搜索可以找到将训练数据完全正确分开的分离超平面。

感知学习算法对偶形式：

对于错误点（xi,yi）的更新：

w<----w+ 机器学习--感知机 yixi

b<----b+ 机器学习--感知机 yi

取w0=0 b0=0 则迭代n次，有

w--- 机器学习--感知机 yixi b---yi 令i=有：

机器学习--感知机

感知机学习算法对偶形式：

1. 机器学习--感知机 --0 b---0

2.在训练集中选取（xi,yi）

3.如果机器学习--感知机 <=0,分类错误：

4. 机器学习--感知机 ----+ b--b+yi

5.转至2直到没有错误分类

输出最终感知机形式:

机器学习--感知机

当训练集可分时，存在无穷多个解，可能由于初值以及迭代顺序不同而导致解不同

若想确定唯一解，需要对分离超平面增加约束条件，例如SVM

相关文章：

2021-04-07
2021-11-28
2021-06-17
2021-06-04
2021-10-07
2021-12-24
2021-12-04

猜你喜欢

2021-10-19
2021-09-18
2021-09-15
2021-12-08
2021-04-20
2021-08-17

相关资源

下载 2023-03-03
下载 2021-06-05
下载 2021-06-06

相似解决方案

热门标签

Java Python linux javascript Mysql C# Docker 算法前端 SpringBoot Redis Vue spring 设计模式 .net core .net kubernetes c++ 数据库数据结构大数据 js 机器学习微服务 Android Go 程序员面试 JVM ASP.net core 云原生人工智能后端 PHP git CSS golang k8s Nginx Django mybatis 深度学习多线程 React 架构 devops 爬虫云计算 Spring Boot LeetCode