数据分析基本概念

商业智能BI、数据仓库DW、数据挖掘DM三者之间的关系

商业智能相对于数据仓库、数据挖掘是一个更大的概念,可以说是基于数据仓库,经过数据挖掘后,得到商业价值的过程。

数据仓库是数据库的升级概念,存储的数据量更大,将原有的多个数据源中的数据汇总整理得到,进入数据仓库前,必须消除不一致性。

数据挖掘的核心包括分类、聚类、预测、关联分析等任务。

 

元数据VS数据元

元数据:描述其他数据的数据,使信息的描述和分类实现了结构化。

数据元:最小的数据单元

数据挖掘的流程

数据挖掘的一个英文解释为Knowledge Discovery in Database,KDD,也称为数据挖掘中的知识发现。

知识发现过程:

(1)输入数据

(2)数据预处理:特征选择、维规约、规范化、选择数据子集等

(3)数据挖掘

(4)后处理:模式过滤、可视化、模式表示

(5)信息

 

 

 

 

相关文章: