分布式 - overfit.cn

Spark Sql

/自定义函数})

overfit同步小助手 2024-06-11 10:03:48 0 收藏

使用 JMX 监控 Kafka 集群性能指标

在大规模的生产环境中，实时监控 Kafka 集群的性能指标是确保系统稳定运行的重要手段。本文将介绍如何使用 JMX（Java Management Extensions）监控 Kafka 集群，并展示一些常用的 JMX 指令和指标。通过使用 JMX 监控 Kafka 集群的性能指标，我们可以更好地了

overfit同步小助手 2024-06-11 10:03:44 0 收藏

RabbitMQ3.13.x之三_RabbitMQ新建用户及开启远程访问

RabbitMQ3.x之三_RabbitMQ新建用户及开启远程访问

overfit同步小助手 2024-06-11 09:03:50 0 收藏

Zookeeper篇——搭建Zookeeper服务器，docker搭建并启动Zookeeper服务，一篇文章手把手教学！

ZooKeeper是一个分布式服务框架，基于Paxos算法实现，提供高可用的数据管理和应用程序协调服务。它的目标是提供一种可靠的、可扩展的、分布式的、可配置的协调机制来统一系统的状态。ZooKeeper曾是Hadoop的正式子项目，后发展成为Apache顶级项目，与Hadoop密切相关但却没有任何依

overfit同步小助手 2024-06-11 07:03:55 0 收藏

RabbitMQ Transport indicated EOF 总结

RabbitMQ Transport indicated EOF

overfit同步小助手 2024-06-11 06:03:36 0 收藏

Spark+Kafka构建实时分析Dashboard案例

本案例利用Spark+Kafka实时分析男女生每秒购物人数，利用Structured Streaming实时处理用户购物日志，然后利用websocket将数据实时推送给浏览器，最后浏览器将接收到的数据实时展现。

overfit同步小助手 2024-06-11 04:03:49 0 收藏

05 Hadoop简单使用

主要讲到了hadoop2.x和hadoop3.x变化，HDFS常用命令，Java操作HDFS，MapReduce，压缩和yarn常用命令。

overfit同步小助手 2024-06-11 03:03:45 0 收藏

【Kafka专栏 01】Rebalance漩涡：Kafka消费者如何避免Rebalance问题？

Kafka中的Rebalance是消费者组（Consumer Group）内部的一个重要机制，它指的是消费者实例之间重新分配Topic分区（Partition）的过程。在Kafka集群中，Rebalance是为了确保消费者组能够均匀地消费数据而设计的。然而，这个过程在某些场景下，如消费者实例的加入或

overfit同步小助手 2024-06-10 23:03:50 0 收藏

Spark Streaming的DStream与窗口操作

DStream是Spark Streaming的核心抽象，它代表了连续的数据流，可以从各种数据源创建，如Kafka、Flume、Socket等。DStream可以看作是一个高级别的抽象，它将实时数据流划分为一系列小的批次（micro-batch），每个批次包含一段时间内的数据。DStream上可以应

overfit同步小助手 2024-06-10 20:03:37 0 收藏

消息队列RabbitMQ

通过本文的介绍，我们了解了消息队列的基本概念及其在传统系统中的应用场景，认识了基于AMQP协议的RabbitMQ，并学习了如何安装RabbitMQ。消息队列在现代分布式系统中起到了至关重要的作用，合理地使用消息队列可以显著提高系统的性能和可靠性。RabbitMQ作为一种成熟的消息队列解决方案，广泛应

overfit同步小助手 2024-06-10 20:03:19 0 收藏

RabbitMQ详细介绍

基于AMQP-Advanced Message Queuing Protocol(高级消息队列协议)规范实现的开源项目。

overfit同步小助手 2024-06-10 13:03:52 0 收藏

Spark中的Driver、Executor、Stage，2024年最新写给大数据开发软件工程师的3条建议

在 Spark 中，有多个概念和组件相互协作，以实现分布式数据处理。(img-2Aj9aXI6-1712533543442)]内容对你有帮助，可以添加VX：vip204888 （备注大数据获取）**

overfit同步小助手 2024-06-10 12:04:00 0 收藏

RabbitMQ 部署及配置详解(集群部署)_rabbitmq集群部署详解

可以将使用不同的端口和特定的网络接口一些分布式系统具有领导节点和从节点。对于 RabbitMQ 来说，通常并非如此。RabbitMQ 集群中的所有节点都是平等的对等节点：RabbitMQ 核心中没有特殊的节点。当仲裁队列和插件时，本主题变得更加微妙被考虑在内，但出于大多数意图和目的，应将所有群

overfit同步小助手 2024-06-10 12:03:52 0 收藏

kafka如何保证消息不丢失

Kafka发送消息是异步发送的，所以我们不知道消息是否发送成功，所以会可能造成消息丢失。而且Kafka架构是由生产者-服务器端-消费者三种组成部分构成的。要保证消息不丢失，那么主要有三种解决方法。

overfit同步小助手 2024-06-10 08:03:38 0 收藏

kafka部署

可见上篇文章，接着做就行（部署所有集群服务器）

overfit同步小助手 2024-06-10 05:03:44 0 收藏

windows系统kafka小白入门篇——下载安装，环境配置，入门代码书写

我们修改 log.dirs 的值为刚才创建的 data 文件夹的路径，在路径末尾再添加上 "/kafka" ，用来和刚才的zk做区分，kafka 文件夹用来存放kafka的日志文件，zk 文件夹用来存放zoopeeper的日志文件；如下图所示，我在生产者命令窗口输入 "hello kafka"，点击

overfit同步小助手 2024-06-10 04:03:49 0 收藏

Kafka 实战 - Kafka优化之实现延时队列

总结来说，在实现 Kafka 延迟队列时，可以根据项目的具体需求、现有技术栈以及团队的开发运维能力，选择上述的一种或多种方法进行组合。生产者根据消息的延迟要求，将消息发送到相应的延迟主题。同时运行一个后台任务（如定时任务或常驻服务），该任务订阅这些延迟主题，当消息到达预期处理时间时，将它们转发到最终

overfit同步小助手 2024-06-10 03:03:52 0 收藏

kafka连接外网加密内网不加密的配置方式_kafka_server_jaas

最全的Linux教程，Linux从入门到精通。

overfit同步小助手 2024-06-09 22:03:10 0 收藏

RabbitMQ无法访问15672端口

1.检查安全组是否允许端口。2.是否启用管理面板插件。

overfit同步小助手 2024-06-09 20:03:23 0 收藏

kafka的leader和follower

在Linux中强制杀掉该Kafka的进程，然后观察leader的情况。kafka的leader负责读写，follower不能读写数据(确保每个消费者消费的数据是一致的)，kafka一个topic有多个分区leader，一样可以实现负载均衡。如果kafka是居于ZK进行选举，ZK的压力比较大，例如某个

overfit同步小助手 2024-06-09 18:03:29 0 收藏