前言

随之大数据时代的到来,大数据技术不断被各行业的人所了解,所熟知。很多人都对这项技术的发展和应用非常关注,同时也对它的前景和它所能创造的财富与机遇抱有很大的期待!现在很多人都开启了他们的大数据之旅,去探索和体会大数据带来的美妙。下面,本文将为你介绍一些相关的大数据术语,可以帮助你加快理解和学习大数据。

一、什么是CYBER空间?

CYBER空间是指计算机网络、通信网络、物联网、移动互联网等一切人造网络和设备构成的空间

二、什么是信息化?

信息化是将现实中所有事物转化成数据并存入CYBER空间的过程

三、什么是数据?

在计算机科学中,数据是指所有能够输入到计算机之中并被计算机程序所处理的符号的介质的总称。
在大数据科学之中,数据是指能够输入到网络空间(CYBER空间)中的任何东西,是指网络空间(CYBER空间)中唯一存在的,可测量的,可处理的,并占有空间的。

四、什么是数据界?

数据界由CYBER空间中所有的数据构成。CYBER空间仅作为数据界的载体。

  • 数据界的数据的增长速度不为人类所控制
  • 数据界中存在大量未知的数据,其中蕴含着未知的现象和未知的规律。这就是发展数据科学的原因之一。
  • 随着科技的进步,产生数据的方式多种多样,所以数据界中数据的类型也多样化,复杂化

由于数据界的以上特点,数据界有时也被人称为数据自然界。

五、何为数据科学?

数据科学是基于数据的科学,基于数据的广泛性和多样性研究数据的共性。它是在CYBER空间(我喜欢称其为异次元空间)探索和发现数据界的理论。与自然科学和社会科学不同,数据科学的研究对象是异次元空间中数据界的数据。(对于数据科学,之后会进行详细的介绍说明,这里仅做简单说明)

六、数据、信息、知识和智慧四者之间的联系

对于数据(Data)、信息(Information)、知识(Knowledge)和智慧(Wisdom)四者之间的联系,我们可以运用DIKW金字塔模型来帮助理解。

以下图片来自于网络
大数据基本术语介绍

大数据基本术语介绍大数据基本术语介绍由上面三张图表可以发现数据可以转化成信息、知识和智慧,可见其的重要性。

下面我举一个列子来帮助理解:

  1. Data:我的藏书之中有数量庞大的,关于水质介绍、水资源循环利用、水源净化、海水淡化技术等水源方面的书籍。
  2. Information:我通过查阅学习这些书籍,实现了一个小型的简单的水源净化系统。
  3. Knowledge:我通过不断的改进和完善,实现了一个大型的功能齐全的海水淡化系统。
  4. Wisdom:我将这个大型功能齐全的海水淡化系统的实现过程与方法编写成册,对其中相关技术的运用进行详细说明与拓展。

七、什么是大数据?

迄今为止还未出现权威的,公认的大数据的定义。但是不可否认的是,大数据是非常重要的战略资源,在未来它的地位将会超越石油,因为大数据永不枯竭、源源不断,同时还蕴含着巨大的价值。

八、对于大数据的描述(4V和5V)

大数据的4V特征:

  1. 容量(Volume)大(PB(10^15)级及其以上的数据)
  2. 类型(Variety)多(结构化数据、半结构化数据、非结构化数据)
  3. 速度(Velocity)快(产生速度快、变化速度也快)
  4. 价值(Value)大(需要注意的是它价值密度低)

5V特征相比于4V特征多了一个 真实(Veracity)性难以判断

总结

以上就是今天我要分享的内容,本文仅仅简单介绍了大数据的一些基本术语,更多的大数据相关知识敬请期待吧!

相关文章: