Feature hashing相关 - 1

考虑典型的文本分类，一个经典的方法就是

分词，扫描所有特征，建立特征词典
重新扫描所有特征，利用特征词典将特征映射到特征空间编号得到特征向量
学习参数 w
存储学习参数 w ，存储特征映射词典
预测截断装载学习参数w，装载特征映射词典
扫描数据，将所有特征利用特征映射词典映射到特征空间编号得到特征向量
利用用学习参数w 对得到的特征向量进行点积做出预测

Feature hashing怎么做？

不使用特征词典了，不用考虑额外的存储词典的空间，直接对特征进行hash编号。

有冲突？后面会说明对效果影响不大！

Feature hashing相关 - 1

Feature hashing相关 - 1

同样的内存占用下我们可以存储更多的weights！

相关文章：

2022-12-23
2021-08-08
2021-12-18
2021-09-25
2022-12-23
2022-01-03
2021-07-16

猜你喜欢

2021-12-10
2022-02-14
2022-01-16
2021-11-25
2021-08-30
2021-07-16

相关资源

下载 2023-01-08
下载 2023-01-23
下载 2023-03-25

相似解决方案

热门标签

Java Python linux javascript Mysql C# Docker 算法前端 SpringBoot Redis Vue spring 设计模式 .net core .net kubernetes c++ 数据库数据结构大数据 js 机器学习微服务 Android Go 程序员面试 JVM ASP.net core 云原生人工智能后端 PHP git CSS golang k8s Nginx Django mybatis 深度学习多线程 React 架构 devops 爬虫云计算 Spring Boot LeetCode