数仓题1
a)作用:数据仓库是一个面向主题的、集成的、时变的、非易失的数据集合。数据仓库通过数据清理、变换、继承、装入和定期刷新等方法,从一个或多个数据源收集信息,存放在一个一致的模式下。数据仓库能够提供大量的、按照实际要求集成的不同主题的数据,通过OLAP引擎对其进行数据挖掘,发现知识。

地位:数据仓库是知识发现过程中不可或缺的一环,它是进行数据挖掘的必要基础。数据仓库能够提供非冗余的有效数据,这些数据都是面向主题的,因此能够大大提高知识发现的能力和效率。没有数据仓库,知识发现就没有数据源。

b) 1、数据仓库中海量数据对单列而言数据重复度可能会比较高,对区分度低的属性用b-tree建立索引存储开销非常大。而bitmap正好适合。
2、b-tree要求查询语句简单,返回结果少。而数据仓库中的复杂查询b-tree往往效率很低。
3、创建b-tree存储的时间复杂度和空间复杂度过高。

c)
对type 索引结果:

ID BOOK CD SOFTWARE
1 1 0 0
2 0 1 0
3 0 0 1
4 1 0 0
5 0 1 0
6 1 0 0
7 0 1 0
8 0 0 1
9 0 1 0
10 1 0 0

对price 索引结果:

ID high middle low free
1 1 0 0 0
2 0 0 1 0
3 1 0 0 0
4 0 1 0 0
5 0 1 0 0
6 0 0 0 1
7 0 0 0 1
8 0 1 0 0
9 0 0 1 0
10 1 0 0 0

相关文章:

  • 2021-05-21
  • 2021-08-15
  • 2022-02-09
  • 2021-08-12
  • 2022-01-09
  • 2022-01-02
  • 2021-08-07
  • 2022-12-23
猜你喜欢
  • 2021-12-04
  • 2021-05-23
  • 2021-12-18
  • 2021-06-03
相关资源
相似解决方案