0


Introduction to Big Data Technologies

作者:禅与计算机程序设计艺术

1.简介

“Big data”这个词很容易被提起,但是它背后真正的含义却并不太清楚。究竟什么是“big data”,它为什么如此重要?许多公司、组织和政府都已经在实施大数据解决方案,但却始终没有得到广泛认同。那么,什么才是真正的“big data”呢?又有哪些技术可以帮助企业实现“big data”的价值?本文试图通过阐述这些问题,以及提供一些相关的知识点和案例,帮助读者更加全面地理解和掌握大数据技术。

2.基本概念与术语

2.1 大数据的定义

“Big data”的中文是指数据量巨大的海量数据集,从字面上看,“big”和“data”显然是相互关联的两个字。那么,到底什么是“big data”呢?“Big data”最早由麻省理工学院(MIT)的皮亚杰(Pajoe)教授在1996年提出,他把“big data”定义为三种类型的数据集合:

  1. Volume: 数据的体积足够大,能够容纳整个网络甚至互联网。
  2. Variety: 数据类型丰富多样,包括图像、文本、视频、音频等各种形式的数据。
  3. Velocity: 数据的产生速度快,实时生成、实时流动、高速移动。

随着互联网、通讯网络和社会媒体的发展,当代互联网产品和服务必将产生海量的数据,这些数据构成了“big data”。这种数据不仅数量巨大,而且随着时间推移呈现出越来越复杂、动态的特征,因而使得传统的数据处理方法根本无法有效应对这些数据。

2.2 Hadoop的定义

Hadoop是一个开源框架&#


本文转载自: https://blog.csdn.net/universsky2015/article/details/132914027
版权归原作者 禅与计算机程序设计艺术 所有, 如有侵权,请联系我们删除。

“Introduction to Big Data Technologies”的评论:

还没有评论