机器学习-nlp-sklearn进行关键词提取（基于tfidf）

背景

tfidf相对词频可以很好的反应出文本中的关键词。本文将使用sklearn进行关键词提取。

实战

机器学习-nlp-sklearn进行关键词提取（基于tfidf）

结巴分词
使用pandas读取csv文件内容
遍历titile内容进行分词

机器学习-nlp-sklearn进行关键词提取（基于tfidf）

加载停用词
遍历进行停词

机器学习-nlp-sklearn进行关键词提取（基于tfidf）

使用sklearn的TfidfVectorizer对文本进行向量化
tfidf.toarray()转换成为矩阵，然后进行行排序，取最后的n个索引（argsort是拿到索引值）
通过get_feature_names获取到词袋的词语
通过索引进行取值

相关文章：

2022-12-23
2021-06-07
2021-11-10
2021-09-04
2021-12-22
2022-01-19
2021-10-18
2023-03-28

猜你喜欢

2021-12-22
2021-09-18
2021-08-29
2021-10-07
2022-12-23
2022-01-13
2022-12-23

相关资源

下载 2022-12-28
下载 2021-06-06
下载 2023-03-16
下载 2021-06-06

相似解决方案

热门标签

Java Python linux javascript Mysql C# Docker 算法前端 SpringBoot Redis Vue spring 设计模式 .net core .net kubernetes c++ 数据库数据结构大数据 js 机器学习微服务 Android Go 程序员面试 JVM ASP.net core 云原生人工智能后端 PHP git CSS golang k8s Nginx Django mybatis 深度学习多线程 React 架构 devops 爬虫云计算 Spring Boot LeetCode