Hadoop生态圈-Hive快速入门篇之Hive环境搭建
作者:尹正杰
版权声明:原创作品,谢绝转载!否则将追究法律责任。
一.数据仓库(理论性知识大多摘自百度百科)
1>.什么是数据仓库
数据仓库,英文名称为Data Warehouse,可简写为集合。它是单个数据存储,出于分析性报告和决策支持目的而创建。 为需要业务智能的企业,提供指导业务流程改进、监视时间、成本、质量以及控制。
2>.数据仓库的特点
第一:数据仓库是面向主题的
操作型数据库的数据组织面向事务处理任务,而数据仓库中的数据是按照一定的主题域进行组织。主题是指用户使用数据仓库进行决策时所关心的重点方面,一个主题通常与多个操作型信息系统相关。
1 首先,主题是一个抽象的概念,是较高层次上企业信息系统中的数据综合,归类并进行分析利用的抽象。在逻辑意义上,它是对应 2 企业中某个宏观分析领域所涉及的分析对象。面向主题的数据组织方式,就是在较高层次上对分析队形的数据的一个完整,一致的描述。 3 能完整,统一的刻画对象所设计的各项数据,以及数据之间的联系。所谓较高层次是相对面向应用的数据组织方式而言的,是指按照主题 4 进行数据组织的方式更高的数据抽象级别。