了解什么是数据挖掘
1.什么是数据挖掘?
数据挖掘(Data Mining)就是从大量的、不完全的、有噪声的、模糊的、随机的实际应用数据中,提取隐含在其中的、潜在的、有价值的信息的过程。
数据挖掘又称为数据库中的知识发现(KDD:Knowledge Discovery in
Database),实际上数据挖掘是知识发现过程的一个基本步骤。
2.知识发现
知识发现过程的基本步骤:
- 数据清理(消除噪声和删除不一致的数据);
- 数据集成(多种数据源可以组合在一起);
- 数据选择(从数据库中提取与分析任务相关的数据);
- 数据变换(通过汇总或聚集操作,把数据变换和统一成适合挖掘的形式);
- 数据挖掘(基本步骤,使用智能方法提取数据模式);
- 模式评估(根据某种兴趣度度量,识别代表知识的真正有趣的模式);
- 知识表示(使用可视化和知识表示技术,向用户提供挖掘的知识)。
3.数据挖掘的相关领域
数据挖掘是多个领域的融合:
- 人工智能
- 数据库
- 统计学
- 并行计算
- 图形学
- …