了解什么是数据挖掘

1.什么是数据挖掘?

数据挖掘(Data Mining)就是从大量的、不完全的、有噪声的、模糊的、随机的实际应用数据中,提取隐含在其中的、潜在的、有价值的信息的过程。

数据挖掘又称为数据库中的知识发现KDD:Knowledge Discovery in
Database
),实际上数据挖掘是知识发现过程的一个基本步骤。

2.知识发现

一、物联网大数据之数据挖掘--数据挖掘的定义

知识发现过程的基本步骤:

  • 数据清理(消除噪声和删除不一致的数据);
  • 数据集成(多种数据源可以组合在一起);
  • 数据选择(从数据库中提取与分析任务相关的数据);
  • 数据变换(通过汇总或聚集操作,把数据变换和统一成适合挖掘的形式);
  • 数据挖掘(基本步骤,使用智能方法提取数据模式);
  • 模式评估(根据某种兴趣度度量,识别代表知识的真正有趣的模式);
  • 知识表示(使用可视化和知识表示技术,向用户提供挖掘的知识)。

3.数据挖掘的相关领域

一、物联网大数据之数据挖掘--数据挖掘的定义
数据挖掘是多个领域的融合:

  • 人工智能
  • 数据库
  • 统计学
  • 并行计算
  • 图形学

4.大数据和数据挖掘的关系

一、物联网大数据之数据挖掘--数据挖掘的定义

相关文章: