分布式 - overfit.cn

Kafka生产者（二）

1、例如我们实现一个分区器实现，发送过来的数据中如果包含 atguigu，就发往 0 号分区，不包含 atguigu，就发往 1 号分区。2、实现步骤（1）定义类实现Partitioner 接口。（2）重写 partition()方法。import org/*** @Copyright：自定义分区

overfit同步小助手 2024-08-27 02:03:44 0 收藏

使用Spring Data JPA简化Java持久层开发

大家好，我是微赚淘客系统3.0的小编，是个冬天不穿秋裤，天冷也要风度的程序猿！Spring Data JPA是Spring提供的一个数据访问抽象层，它极大地简化了与数据库的交互，让我们能够以更加简洁的方式进行数据持久化操作。通过Spring Data JPA，我们可以大大简化Java持久层的开发工作

overfit同步小助手 2024-08-26 20:02:19 0 收藏

《Linux运维总结：基于银河麒麟V10+ARM64架构CPU部署zookeeper 3.8.4二进制分布式集群》

《Linux运维总结：基于Ubuntu 22.04+ARM64架构CPU部署zookeeper 3.8.4二进制分布式集群》

overfit同步小助手 2024-08-26 17:03:56 0 收藏

【Hadoop】建立圈内组件的宏观认识（大纲版）

【Hadoop】建立圈内组件的宏观认识的大纲，属于精炼的概述性科普，后续会进行优化

overfit同步小助手 2024-08-26 14:03:36 0 收藏

Kafka深入解析

overfit同步小助手 2024-08-26 10:03:53 0 收藏

RabbitMQ 迁移

如果您只需要导出和导入RabbitMQ的定义（如vhost、exchange、queue等），可以使用RabbitMQ的 HTTP API。

overfit同步小助手 2024-08-26 09:03:47 0 收藏

大数据-100 Spark 集群 Spark Streaming DStream转换黑名单过滤的三种实现方式

上节研究了Spark Streaming 基础数据源，文件流、Socket流、RDD队列流等内容，基础概念、代码实例等等。本节研究DStream的转换，同时附带一个黑名单过滤业务的实现案例，包含三种实现的方式。一个功能强大的函数，它可以允许开发者直接操作其内部的RDD，也就是说开发者，可以任意提供

overfit同步小助手 2024-08-26 09:03:29 0 收藏

大数据-99 Spark 集群 Spark Streaming DStream 文件数据流、Socket、RDD队列流

上节研究了SparkStreaming基础概述、架构概念、编程模型、优缺点概括等内容。本节研究Spark Streaming DStream 文件数据数据流、Socket、RDD队列流等内容。每秒创建一个RDD（RDD存放1-100的整数），Streaming每隔1秒就对数据进行处理，计算RDD中数

overfit同步小助手 2024-08-26 08:03:14 0 收藏

你知道Kafka和Redis的各自优缺点吗？一文带你优化选择，不走弯路

按照上面的过程，4个月的时间刚刚好。当然Java的体系是很庞大的，还有很多更高级的技能需要掌握，但不要着急，这些完全可以放到以后工作中边用别学。学习编程就是一个由混沌到有序的过程，所以你在学习过程中，如果一时碰到理解不了的知识点，大可不必沮丧，更不要气馁，这都是正常的不能再正常的事情了，不过是“人同

overfit同步小助手 2024-08-26 03:03:44 0 收藏

ZooKeeper Watcher 机制详解

ZooKeeper 的 Watcher 机制是分布式系统中用于事件通知的重要功能。

overfit同步小助手 2024-08-25 23:03:44 0 收藏

ZOOKEEPER+KAFKA消息队列群集

消息(Message)是指在应用间传送的数据。消息可以非常简单，比如只包含文本字符串，也可以更复杂，可能包含嵌入对象。消息队列(Message Queue)是一种应用间的通信方式，消息发送后可以立即返回，由消息系统来确保消息的可靠传递。消息发布者只管把消息发布到MQ 中而不用管谁来取,消息使用者只管

overfit同步小助手 2024-08-25 23:03:18 0 收藏

不同操作系统中如何搭建RabbitMQ开发环境？

Erlang（['ə:læŋ]）是一种通用的面向并发的编程语言，它由瑞典电信设备制造商爱立信所辖的CS-Lab开发，目的是创造一种可以应对大规模并发活动的编程语言和运行环境。最初是由爱立信专门为通信应用设计的，比如控制交换机或者变换协议等，因此非常适合构建分布式、实时软并行计算系统。Erlang运行

overfit同步小助手 2024-08-25 17:03:21 0 收藏

10大秘籍助力大数据开发者成为行业顶尖人才｜Spark优化技巧 + 软技能进阶

大数据开发者如何突破技术瓶颈？本文深入探讨Spark性能优化、数据倾斜处理等技术挑战，并提供实用的职场软技能提升策略。通过系统化的学习方法、跨团队协作技巧和个人品牌建设，助你在竞争激烈的大数据行业脱颖而出。文章包含业内专家洞见、实战编程挑战，以及自我评估工具。无论你是初级数据工程师还是资深大数据架构

overfit同步小助手 2024-08-25 15:04:02 0 收藏

分布式锁选型 Redis vs Zookeeper

分布式锁作为分布式环境下并发控制利器，使用场景广泛。分布式锁通常可利用中间件Redis或Zookeeper来实现，例如针对Java语言Redis有Redisson组件， Zk有Curator组件。从其中间件属性就可以看出Redis是偏AP，而Zk是偏CP的。

overfit同步小助手 2024-08-25 15:03:45 0 收藏

CentOS7安装Hadoop集群

Centos7部署Hadoop3.3.6以及Hive3.1.3

overfit同步小助手 2024-08-25 10:03:44 0 收藏

大数据-98 Spark 集群 Spark Streaming 基础概述架构概念执行流程优缺点

上节研究了SparkSQL的JOIN操作，Broadcast、Shuffle、SQL解析的过程详解，SparkSQL的详细优化思路。本节研究SparkStreaming的接触概述，背景概述、基本概念、架构概念、容错性等等。随着大数据技术的不断发展，人们对于大数据的实时性处理要求也不断提高，传统的Ma

overfit同步小助手 2024-08-25 08:03:27 0 收藏

Rabbitmq的几种工作模式

的交换机(具体交换机的类型和概念小伙伴们可以自行查阅下，这里主要讲工作模式)，生产者将消息发送给这个交换机，这个交换机把消息发送给每一个和其绑定的队列(注意。#号表示支持匹配多个词；*号表示只能匹配一个词，假如同一个队列与交换机直接设置的多个模糊的key都符合传入的，那么也只传送一次。的交换机不需要

overfit同步小助手 2024-08-25 07:03:41 0 收藏

Zookeeper中 Server 服务器的四种工作状态详解

ZooKeeper集群中的服务器主要存在以下四种工作状态，每种状态都清晰地反映了服务器在集群中的角色和职责：

overfit同步小助手 2024-08-25 05:03:36 0 收藏

Kafka01-Kafka生产者发送消息方式(发送即忘、同步、异步）

接着，它演示了三种发送方式：发送即忘、同步发送和异步发送。在异步发送的例子中，我们注册了一个回调函数来处理消息发送成功或失败的情况。：异步发送结合了发送即忘和同步发送的特点。生产者在发送消息后不会立即等待服务器的确认，而是继续发送下一条消息。：这种方式是最简单的发送模式，生产者发送消息后不会等待

overfit同步小助手 2024-08-25 02:03:56 0 收藏

一次讲清模型并行、数据并行、张量并行、流水线并行区别nn.DataParallel[分布式]

通过这种行切分的方式,张量并行能够有效地将大型矩阵分散到多个GPU上,既解决了单GPU内存不足的问题,又保持了计算的数学等价性。总的来说,张量并行的核心思想是利用分块矩阵的计算原理,将大矩阵切分到不同设备上,通过通信操作保证数学等价性。当然，张量并行中的行并行（Row Parallelism）是一种

overfit同步小助手 2024-08-25 00:02:27 0 收藏