MapReduce课程设计 好友推荐功能
好友推荐算法在实际的社交环境中应用较多,比如qq软件中的“你可能认识的好友° 或者Facebook中的好友推介。好友推荐功能简单的说是这样一个需求,预测菜两个人是否认识,并推荐为好友,并且某两个非好友的用户,他们的共同好友越多。那么他们越可能认识。
【Flink】flink的安装部署(1)
Flink集群的搭建,local,standalone,flink on yarn。
【Flink】flink入门案例(2)
flink入门案例,flink wordcount单词计数
Hadoop大数据平台搭建环境 提供虚拟机相关配置
我把已经搭建好的虚拟机环境放在了百度网盘上,需要的同学自取即可。
大数据面试之flume重点
大数据面试之flume重点
【精通Spark系列】弹性分布式数据集RDD快速入门篇
本篇文章属于Spark系列文章,专栏将会记录从spark基础到进阶的内容,,内容涉及到Spark的入门集群搭建,核心组件,RDD,算子的使用,底层原理,SparkCore,SparkSQL,SparkStreaming等,
大数据趣味学习探讨(三):怎么确定学习目标
战点就是战斗的机会根本轮不到你奋斗有一个真相,年轻人必须明白,而且越早明白越好,那就是拼命不可怕,加班不可怕,辛苦也不可怕,真正可怕的是根本轮不到你去拼命。肩膀脱臼不可怕,绷带上场不可怕,单场跑动16公里也不可怕,真正可怕的是直到哨声响起,你都没有等到一次上场的机会啊。你准备了一辈子,却发现根本没有
[平台运维、Hadoop]Spark Streaming 实时计算框架
在大数据技术中,有离线计算、批量计算、实时计算以及流式计算,其中,离线计算和实时计算指的是数据处理的延迟;批量计算和流式计算指的是数据处理的方式。Spark Streming是构建在Spark上的实时计算框架,且是对Sparks Core API的一个扩展,它能够实现对流数据进行实时处理,并具有很好
【大数据】Hadoop在呼唤Hive(附一键部署Hive脚本)
汝之观览,吾之幸也!本文主要讲解Hive部署到Hadoop集群并使用,结尾附一键部署Hive脚本
大数据趣味学习探讨(二):我是怎么坚持学习的
2.1、调研日前,北京大数据研究院联合大数据分析与应用技术国家工程实验室、北京治数科技有限公司共同发布了《2022年中国大数据产业发展指数报告》。研究团队在2020年、2021年连续发布大数据产业发展指数的基础上,深入调研了各地大数据政策环境、大数据产业和企业发展状况,基于自身企业库中收录的 747
Hadoop集群完全分布式搭建
hadoop集群分布式的搭建
从商业化部门架构看 广告产品经理知识框架
商业产品技术部共有7个小组,除去产品和测试,剩下的5个技术小组分别负责商家平台、前端页面、工程、策略和广告外投也就是联盟。下面我们再分别看一下各个小组所负责的事情和职责是什么。
大数据开发工程师是做什么的?岗位要求高吗?
大数据开发工程师是做什么的?岗位要求高吗?大数据开发工程师要负责数据仓库建设、ETL开发、数据分析、数据指标统计、大数据实时计算平台及业务开发、平台建设及维护等工作内容。熟练掌握数据仓库、hadoop生态体系、计算及二次开发、大数据平台工具的开发:开发平台、调度系统、元数据平台等工具,该岗位对于技术
我眼中的大数据(四)——Yarn和Hive
但是Yarn并不是随Hadoop的推出一开始就有的,Yarn作为分布式集群的资源调度框架,它的出现伴随着Hadoop的发展,使Hadoop从一个单一的大数据计算引擎,成为一个集存储、计算、资源管理为一体的完整大数据平台,进而发展出自己的生态体系,成为大数据的代名词。在Hadoop早期的时候,大数据技
客快物流大数据项目(七十八):Hue简介
HUE是一个开源的。
毕业设计 大数据全国疫情数据分析与3D可视化 - python 大数据
🔥 这两年开始毕业设计和毕业答辩的要求和难度不断提升,传统的毕设题目缺少创新和亮点,往往达不到毕业答辩的要求,这两年不断有学弟学妹告诉学长自己做的项目系统达不到老师的要求。为了大家能够顺利以及最少的精力通过毕设,学长分享优质毕业设计项目,今天要分享的是🚩大数据全国疫情数据分析与3D可视化🥇学长
【毕业设计】基于大数据的抖音短视频数据分析与可视化 - python 大数据 可视化
🔥 这两年开始毕业设计和毕业答辩的要求和难度不断提升,传统的毕设题目缺少创新和亮点,往往达不到毕业答辩的要求,这两年不断有学弟学妹告诉学长自己做的项目系统达不到老师的要求。为了大家能够顺利以及最少的精力通过毕设,学长分享优质毕业设计项目,今天要分享的是🚩基于大数据的抖音短视频数据分析与可视化🥇
Hadoop,VMware,Xshell,Xftp,CentOS,安装和部分问题详解(真的很详细)
Hadoop想必困扰很多学生,笔者就弄了一周,这里本人亲手写和实践的一份超详细的安装流程。
湖仓一体电商项目(二十三):离线业务 统计每天用户商品浏览所获积分
使用Iceberg构建湖仓一体架构进行数据仓库分层,通过Flink操作各层数据同步到Iceberg中做到的离线与实时数据一致,当项目中有一些离线临时性的需求时,我们可以基于Iceberg各层编写SQL进行数据查询,针对Iceberg DWS层中的数据我们可以编写SQL进行离线数据指标分析。当前离线业
hadoop大数据集群搭建(二)超级保姆式教学
本篇为为hadoop集群配置的中章, 包含如下内容, 1. 关闭防火墙 2. 集群之间的免密登录 3. 完成集群的时间同步问题 4. 安装MySQL 5. 安装JDK终章将会手把手完成最后的软件安装及配置和体验!