作者:禅与计算机程序设计艺术
1.简介
“Big data”这个词很容易被提起,但是它背后真正的含义却并不太清楚。究竟什么是“big data”,它为什么如此重要?许多公司、组织和政府都已经在实施大数据解决方案,但却始终没有得到广泛认同。那么,什么才是真正的“big data”呢?又有哪些技术可以帮助企业实现“big data”的价值?本文试图通过阐述这些问题,以及提供一些相关的知识点和案例,帮助读者更加全面地理解和掌握大数据技术。
2.基本概念与术语
2.1 大数据的定义
“Big data”的中文是指数据量巨大的海量数据集,从字面上看,“big”和“data”显然是相互关联的两个字。那么,到底什么是“big data”呢?“Big data”最早由麻省理工学院(MIT)的皮亚杰(Pajoe)教授在1996年提出,他把“big data”定义为三种类型的数据集合:
- Volume: 数据的体积足够大,能够容纳整个网络甚至互联网。
- Variety: 数据类型丰富多样,包括图像、文本、视频、音频等各种形式的数据。
- Velocity: 数据的产生速度快,实时生成、实时流动、高速移动。
随着互联网、通讯网络和社会媒体的发展,当代互联网产品和服务必将产生海量的数据,这些数据构成了“big data”。这种数据不仅数量巨大,而且随着时间推移呈现出越来越复杂、动态的特征,因而使得传统的数据处理方法根本无法有效应对这些数据。
2.2 Hadoop的定义
Hadoop是一个开源框架&#
版权归原作者 禅与计算机程序设计艺术 所有, 如有侵权,请联系我们删除。