Kafka核心原理第一弹——更新中

kafka的通信主要发生于生产端和broker之间,broker和消费端之间,broker和broker之间,这些通信都是基于TCP协议进行的,大家自己看看网络课程,底层基于TCP连接和传输数据,应用层的协议,是Kafka自己自定义的所谓自定义协议,就是定好传输数据的格式,请求格式、响应格式,这样大

FlinkSQL kafka完整案例 可直接复制使用

完整案例,可以直接使用。flinksql 消费kafka整体来说是十分简单好用的,使用时门口较低,实时性又高

Hive 中 sort by 和 order by 的区别

在 Hive 中,SORT BY和ORDER BY都用于对查询结果进行排序,但它们在实现方式和适用场景上有一些区别。

zookeeper 理论合集

用于管理分布式系统,使一个系统中的节点知道其他节点的状态。实现方式?通过维护和监控存储的数据变化,达到基于数据的集群一致性管理。简单说,zookeeper = 文件系统 + 监控通知机制配置维护、域名维护、分布式同步、服务发现等C:保证「,并不保证强一致性,在十几秒可以Sync到各个节点(如果保证强

【HDFS】每天一个RPC系列----complete(二):客户端侧

【HDFS】每天一个RPC系列----complete(二):客户端侧

2023_Spark_实验九:Scala函数式编程部分演示

Scala,基于idea开发wordcout。

大数据之使用Flume监听端口采集数据流到Kafka

本题来源于全国职业技能大赛之大数据技术赛项电商赛题 - 实时数据采集题目很简单。大数据处理涉及到海量的数据采集和处理,如何高效地采集数据是一个重要的问题。Flume是一个分布式的、可靠的、高可用的海量日志采集工具,可以轻松地采集、聚合和移动大量的数据。在数据采集过程中,Flume可以使用网络协议、文

Flink、Yarn架构,以Flink on Yarn部署原理详解

Flink、Yarn架构,以Flink on Yarn部署原理详解

RabbitMQ源码分析之日志系统

RabbitMQ是一个开源的消息队列系统,本文将从RabbitMQ服务器日志系统的设计和实现中,对其进行深入剖析。RabbitMQ服务器基于Erlang开发而成,具有高吞吐量、低延迟等优点。同时,它支持多种消息中间件协议,如AMQP、MQTT、STOMP等。本文不讨论RocketMQ消息中间件协议,

Hbase 系列教程:HBase 搭建高可用集群

作者:禅与计算机程序设计艺术 1.简介Apache HBase 是 Apache 基金会开源项目之一,是一个分布式 NoSQL 数据库。它是一个可扩展的、面向列的、存储在 Hadoop 文件系统(HDFS)上的结构化数据存储。它支持 Hadoop 的 MapRe

泰迪大数据实训平台产品介绍

大数据实训管理平台、大数据开发实训平台、大数据编程实训平台

kafka晋升之路-理论+场景

本文讲解了kafka的基本概念、常见问题、通过此篇文章,相信你对kafka已经有了一定的了解,赶紧实验起来吧。

RabbitMQ的使用

1、大多应用中,可通过消息服务中间件来提升系统异步通信、扩展解耦能力消息代理(message broker)和目的地当消息发送者发送消息以后,将由消息代理接管,消息代理保证消息传递到指定目的地。3、消息队列主要有两种形式的目的地队列(queue):点对点消息通信(point-to-point)主题(

科普rabbitmq,rocketmq,kafka三者的架构比较

拉取消息:RocketMQ 的消费者(Consumer)通过订阅 Topic 和指定消费者组(Consumer Group)来拉取消息。发送消息:RocketMQ 的生产者(Producer)将消息发送到指定的 Topic,并不能直接选择要发送到的队列,而是由 Broker 负责将消息分发到相应的队

处理el-table大数据卡顿的问题,包含tree型数据格式

有时候el-table的数据可能有成千上万条,而且又要在一页显示完,这时候页面渲染的dom太多了,可能会造成页面卡顿。因为数据量过多导致浏览器渲染过多的标签元素 导致DOM树占用内存较大 使得用户操作阻塞。具体原理可参考别的大佬写的文章:DOM性能瓶颈与Javascript性能优化.使用第三方插件

Spark SQL

Spark SQL属于Spark计算框架的一部分,是专门负责结构化数据的处理计算框架,Spark SQL提供了两种数据抽象:DataFrame、Dataset,都是基于RDD之上的一种高级数据抽象,在RDD基础之上增加了一个schema表结构。DataFrame是以前旧版本的数据抽象(untyped

配置开启Hive远程连接

使用IDEA工具远程连接Hive,首先需要配置开启Hive远程连接支持,主要有2种方式来配置开启Hive远程连接。

Hadoop 集群规划与部署最佳实践

2009年2月2日,Apache Hadoop项目诞生。它是一个开源的分布式系统基础架构,用于存储、处理和分析海量的数据。Hadoop具有高容错性、可靠性、可扩展性、适应性等特征,因而广泛应用于数据仓库、日志分析、网络流量监测、推荐引擎、搜索引擎等领域。由于Hadoop采用“分而治之”的架构设计理念

基于Hadoop的学生校园网行为分析

🙌😂oi退役选手,Java、大数据、单片机、IoT均有所涉猎,热爱技术,技术无罪获取源码,添加WX。

登录可以使用的更多功能哦! 登录
作者榜
...
资讯小助手

资讯同步

...
内容小助手

文章同步

...
Deephub

公众号:deephub-imba

...
奕凯

公众号:奕凯的技术栈