2024年计算机专业大数据选题推荐✅(最新、最全、最容易通过的选择)

💗博主介绍:✌全网粉丝10W+,CSDN特邀作者、博客专家、CSDN新星计划导师、全栈领域优质创作者,博客之星、掘金/华为云/阿里云/InfoQ等平台优质作者、专注于Java、小程序技术领域和毕业项目实战✌💗👇🏻精彩专栏 推荐订阅👇🏻2023-2024年最值得选的微信小程序毕业设计选题大

HDFS 常见基础操作命令

hdfs基本操作命令

解决安装 RabbitMQ 安装不成功的问题

由于RabbitMQ是基于erlang的,所以,在正式安装RabbitMQ之前,需要先安装一下erlang。

大数据岗位秋招面试八股文总结(不定时更新)

第一次是局部聚合,先给每个key都打上一个随机数,比如10以内的随机数,此时原先一样的key就变成不一样的了,比如(hello, 1) (hello, 1) (hello, 1) (hello, 1),就会变成(1_hello, 1) (1_hello, 1) (2_hello, 1) (2_hel

0基础学习PyFlink——用户自定义函数之UDTAF

PyFlink UDF UDTF UDAF UDTAF

基于Kylin的数据统计分析平台架构设计与实现

前言此项目是我在TP-LINK公司云平台部门做的一个项目,总体包括云上数据自动化统计流程的设计和组件的开发。目的是为了对云平台上的设备和用户数据做多维度的统计和分析,以及便于观察设备数据的历史趋势,让业务部门更好地做业务决策。整体的架构与数据流向如下图所示,采用Hive做数据仓库,使用Spark实现

hive sql 拆解字段

在Hive SQL中,拆解字段通常涉及到字符串操作,如将一个包含多个部分的字符串拆解成多个独立的字段。2. SPLIT(str, delimiter):使用SPLIT函数可以根据指定的分隔符将字符串拆分为一个数组,这对于将含有多个值的字符串拆分成独立的字段非常有用。你可以指定起始位置和要提取的长度。

Nacos与Eureka的区别

大家好我是苏麟今天说一说Nacos与Eureka的区别.

Flink CDC MySQL同步MySQL错误记录

错误1:Connector ‘mysql-cdc’ can only be used as a source. It cannot be used as a sink.问题2:Encountered “AUTO_INCREMENT”问题3:Encountered “DEFAULT”处理方法:删除AU

2023.11.10 hadoop,hive框架概念,基础组件

任务:1.确认hadoop,hive环境搭建完成2.确认能使用hadoop,hive启动服务的命令,datagrip连接hive服务操作3.背诵/流畅表达 hadoop的架构,各组件之间的关系4.说明hive的流程,元数据的概念。

三十分钟学会zookeeper

一些分布式系统通过复制数据来提高系统的可靠性和容错性,并且将数据的不同的副本存放在不同的机器在数据有多份副本的情况下,如果网络、服务器或者软件出现故障,会导致部分副本写入成功,部分副本写入失败。这就造成各个副本之间的数据不一致,数据内容冲突。

SpringCloud微服务 【实用篇】| Eureka注册中心、Ribbon负载均衡

SpringCloud微服务 【实用篇】| Eureka注册中心、Ribbon负载均衡

Kafka、RabbitMQ、RocketMQ中间件的对比

Kafka是Apache下的一个子项目,是一个高性能跨语言分布式Publish/Subscribe消息队列系统,而Jafka是在Kafka之上孵化而来的,即Kafka的一个升级版。支持Hadoop数据并行加载,对于像Hadoop的一样的日志数据和离线分析系统,但又要求实时处理的限制,这是一个可行的解

数据仓库-日期维度表的设计与实现

本文基于python的chinese_calendar和pymysql库编写了一个生成日期维表(日期-工作日-节假日维度表),用于对业务主题表进行维度建模,实现方式简单,一键生成,数据可靠。

Introduction to Hadoop Ecosystem for Data Science

作者:禅与计算机程序设计艺术 1.简介Hadoop Ecosystem 是一个基于Java的开源框架,主要用于存储、处理和分析海量数据。其提供的组件包括HDFS(Hadoop Distributed File System),MapReduce(分布式计算框架)

SpringCloudStream集成RabbitMQ实现消息收发

​ SpringCloudStream 是一个构建高扩展和事件驱动的微服务系统的框架,用于连接共有消息系统,官网地址:。整体上是把各种花里胡哨的MQ产品抽象成了一套非常简单的统一的编程框架,以实现事件驱动的编程模型。社区官方实现了RabbitMQ,Apache Kafka,Kafka Stream和

【flink-sql实战】flink 主键声明与upsert功能实战

flink主键声明与upsert

Linux——kafka常用命令

kafka常用命令

JAVA操作HDFS集群

本文介绍了使用Java操作HDFS集群的方法,具体的操作包括创建目录、删除文件、移动与重命名文件、查询文件信息以及文件的上传和下载等。通过示例代码和截图展示了每个操作的实际效果,帮助读者理解和使用HDFS安全模式和相关操作。

登录可以使用的更多功能哦! 登录
作者榜
...
资讯小助手

资讯同步

...
内容小助手

文章同步

...
Deephub

公众号:deephub-imba

...
奕凯

公众号:奕凯的技术栈