zhangshuheng

《数据挖掘原理及应用》学习1

感觉最近数据挖掘挺火的,但是对其的作用有正面的评价,也有负面的评价,不管怎样,先试着学习一下里面的基本知识。

1. 数据挖掘的主要目的

    从已有数据中提取模式,提高已有数据的内在价值,并且把数据提炼成知识。而这一点并不同于简单的数据库操作,例如考察上大学同性别、IQ、父母鼓励、收入等方面的关系,即使是大量的select语句也很难分析出来,而使用决策树方法就可以很简单地反映比如如果IQ超过100并且父母支持,则90%的学生可以上大学,这就是一种反映出来的模式。

2. why data mining is so hot?

    大量数据,例如互联网上大量的数据,堆在一起没什么用,而通过对其进行分析后,可能挖掘出隐含的模式,指导企业发展;市场竞争激烈;数据挖掘技术成熟。

3. 数据挖掘常见任务

    分类、聚类、关联性分析、回归、用来预测、序列分析和偏差分析

4. 数据挖掘的流程

    数据搜集。

    数据清理和转换:去掉噪声和不相关的信息,并且将数据转换成统一格式利于处理。例如删除孤立点,去掉那些偶然才发生的事件,才能反映更为普遍的规律;缺失值处理,使用平均值代替,删掉缺失值太多的记录;数据类型转换;连续值转换(分成桶的方法)等。

    模型构建:关键步骤,针对数据挖掘的目标来使用不同模型构建,一般需要多构建几种进行比较。

    模型评估:评估哪种模型对此次事件更为精确,最有名的方法是提升图。在评估过程中一定要同提供数据的相关人士进行探讨,找出对商业发展有用的信息。

    报告,预测,应用集成,模型管理:模型应用在具体实例中的过程。

分类:

技术点:

相关文章:

  • 2021-07-15
  • 2021-09-16
  • 2022-01-23
  • 2021-12-10
  • 2021-12-02
  • 2021-10-11
  • 2021-04-16
猜你喜欢
  • 2021-05-28
  • 2021-12-28
  • 2021-09-01
  • 2022-02-09
  • 2021-06-15
  • 2021-12-26
  • 2022-12-31
相关资源
相似解决方案