第一章 初识Hadoop
1、了解大数据,能够描述大数据的概念、数据类型、特征、和研究意义
a. 概念:从字面意思来看,大数据指海量数据;从特点来看,大数据具有海量、流转快、数据类型丰富及价值密度低等特点
b. 数据类型:大数据的数据类型丰富多样,包括网页文件、表格文件、XML文件、文本数据、多媒体数据(视频、图片等)。按数据结构来分为 1)结构化数据 (标准化格式的数据) 2)半结构化数据 (描述文本记录的数据 XML文件、HTML文件、JSON文件) 3)非结构化数据(文本文件、图片视频等)
c. 特征:1)大量 2)真实 3)多样 4)低价值密度 5)高速
d. 研究意义:研究大数据最重要的意义就是预测。数据从根本上来说就是对过去和现在的归纳和总结。其本身并不具备趋势和方向性的特征。但可以用于了解事物发展的客观规律和人类的行为特征等。
2、了解大数据的应用场景,能够描述大数据在医疗、金融和零售业中的应用
a. 在医疗中的应用:通过对医疗大数据进行分析,人类可以预测流行疾病的发展趋势、避免感染、降低医疗成本等,还能让患者享受到更加便利的服务。医学影像评估、医院管理决策辅助、
b. 在金融中的应用:1.风险管控 2运营优化
c. 在零售业中的应用:1打造智慧的购物体验 2.构建智慧的商品服务管理和供应链网络
3、了解Hadoop的前世今生,能够说出Hadoop的发展过程
<
版权归原作者 做个尘世俗人 所有, 如有侵权,请联系我们删除。