分布式 - overfit.cn

Kafka事务是怎么实现的？Kafka事务消息原理详解（文末送书）

Kafka事务性消息是一项关键的功能，为确保数据一致性提供了重要的支持。在本部分，我们将深入了解Kafka事务性消息的基本概念。Kafka事务性消息的概念Kafka事务性消息是一种机制，用于确保消息的可靠性传递和处理。与非事务性消息相比，它们在数据处理中提供了额外的保证。一旦消息被写入Kafka集群

overfit同步小助手 2023-12-17 09:03:35 0 收藏

分布式计算第五章大数据多机计算：Hadoop

• NameNode：每个集群一个（也可以有备份），用于维护文件系统的元数据（命名空间），执行文件系统命名空间上的操作，如打开、关闭、重命名文件和目录，以及确定块（Block）和DataNode的映射。• 针对大型数据集，典型文件大小为GB到TB级，不适合小文件读取，并应当在数百个节点上支持数千万的

overfit同步小助手 2023-12-17 06:03:40 0 收藏

hadoop权威指南第四版

迭代处理(iterative processing) spark.例如机器学习算法，需要很多迭代。4 SEARCH 搜索 solr (Solr它是一种开放源码的、基于Lucene Java 的搜索服务器)。因为计算机硬盘的发展趋势是：寻址时间的提升远远不如传输速率的提升，如果访问包含大量地址的

overfit同步小助手 2023-12-17 00:03:53 0 收藏

数据仓库高级面试题

overfit同步小助手 2023-12-16 16:03:36 0 收藏

XXL-JOB分布式任务调度

时间轮出自Netty中的HashedWheelTimer，是一个环形结构，可以用时钟来类比，钟面上有很多bucket，每一个bucket上可以存放多个任务，使用一个List保存该时刻到期的所有任务，同时一个指针随着时间流逝一格一格转动，并执行对应bucket上所有到期的任务。支持可视化、简单且动态的

overfit同步小助手 2023-12-16 09:03:24 0 收藏

2.FastRunner定时任务Celery+RabbitMQ

解决celery执行时报错：KeyError: 'async' 报错原因：Python3.6及以上版本和celebry4.0以上版本中async关键字发生冲突。python manage.py celery beat -l info 启动beat监听定时任务。1.安装rabbmitMQ中间件，并配

overfit同步小助手 2023-12-16 06:03:36 0 收藏

部署Kafka

overfit同步小助手 2023-12-16 01:03:43 0 收藏

ClickHouse Keeper: 一个用 C++ 编写的 ZooKeeper 替代品

介绍 ClickHouse Keeper 的特点和优势，它是 ZooKeeper 资源的高效开源替代品。

overfit同步小助手 2023-12-15 13:03:24 0 收藏

XXL-JOB深入浅出

XXL-JOB 是一个轻量级分布式任务调度平台，其核心设计目标是开发迅速、学习简单、轻量级、易扩展。现已开放源代码并接入600多家公司线上产品线，开箱即用。xxl是xxl-job的开发者大众点评的许雪里名称的拼音开头（我没吹，官网就是这么介绍的）。

overfit同步小助手 2023-12-15 13:02:27 0 收藏

启动Dubbo项目注册Zookeeper时提示zookeeper not connected异常原理解析

可见启动Dubbo项目注册Zookeeper时提示zookeeper not connected异常，是因为没有在配置里设置连接超时，而是使用了默认的5秒，导致5秒内没有成功连接，就出现连接异常而无法成功连接，当调长时间后，就正常连接成功了，同时也说明了，这次本地连接zookeeper集群的时间超过

overfit同步小助手 2023-12-15 08:03:40 0 收藏

hadoop完全分布式搭建

Hadoop完全分布式搭建需要按照以下步骤进行：安装虚拟机：首先需要安装虚拟机软件，例如VMware等，然后在虚拟机软件中创建新的虚拟机，设置虚拟机的操作系统、内存、处理器等参数。配置网络：在虚拟机中配置网络，使得虚拟机可以与外部网络进行通信。安装Hadoop：在虚拟机中安装Hadoop，并配置相关

overfit同步小助手 2023-12-15 08:03:22 0 收藏

rabbitmq 交换机相关实例代码

定义交换机和队列,其中路由可以根据规则匹配，*表示匹配一个任意字符，#表示一个或多个。定义扇形交换机发送端，发送时，第二个参数是路由，不需要设置。当点击发送后，以上三个方法都会接受到消息，不需要路由。定义扇形交换机和队列。定义主题交换机发送端。定义扇形交换机接收端。定义主题交换机接收端。

overfit同步小助手 2023-12-15 04:03:20 0 收藏

ELK+kafka+filebeat企业内部日志分析系统

本文主要详细讲述了ELK+kafka+filebeat企业内部日志分析系统，如何操作以及解决配置过程中的相关问题

overfit同步小助手 2023-12-14 20:03:14 0 收藏

spark -- 数据计算框架

spark作为大数据组件中不可或缺的一大部分是我们学习和了解大数据的过程中必须要经历和学习的部分本人将自己当初学习大数据的一点点心得和体会作为笔记希望可以给同样在学习大数据同学提供一点点的帮助同时也希望可以得到大家的指正。

overfit同步小助手 2023-12-14 12:03:37 0 收藏

详解Kafka分区机制原理｜Kafka 系列二

Kafka 系列第二篇，详解分区机制原理。为了不错过更新，请大家将本号“设为星标”。点击上方“后端开发技术”，选择“设为星标” ，优质资源及时送达上一篇文章介绍了 Kafka 的基本概念和术语，里面有个概念是分区(Partition)。kafka 将一个Topic 中的消息分成多份，分别存储在不

overfit同步小助手 2023-12-14 12:03:23 0 收藏

Kafka 集群如何实现数据同步？

Kafka 是一个高吞吐的分布式消息系统，不但像传统消息队列（RaabitMQ、RocketMQ等）那样能够【异步处理、流量消峰、服务解耦】还能够把消息持久化到磁盘上，用于批量消费。除此之外由于 Kafka 被设计成分布式系统，吞吐量和可用性大大提高Kafka 角色kafka 客户端生产者（prod

overfit同步小助手 2023-12-14 09:03:54 0 收藏

kafka报错

启动Kafka出现The Cluster ID doesn’t match stored clusterId错误需要删除在kafka路径下面的logs里面的meta.properties，这是因为 cluster.id 不匹配。

overfit同步小助手 2023-12-14 02:03:44 0 收藏

如何本地搭建开源分布式任务调度系统DolphinScheduler并远程访问

overfit同步小助手 2023-12-13 23:04:06 0 收藏

手动修复 rabbitmq 报错 “Crash dump is being written to“

(5) 查找 wal 文件路径，查找的路径来自步骤 (4)(3) 在 pod 节点上查看对应的物理设备。此步骤请慎重操作，建议将文件备份后再操作。(7) 删除 pod，重新启动 pod。(6) 删除 wal 文件。(4) 查看设备挂载目录。

overfit同步小助手 2023-12-13 23:03:33 0 收藏

Kafka Connect ：构建强大分布式数据集成方案

在本篇文章中，深入探讨了 Kafka Connect 的核心架构、实战应用以及高级特性。通过详细的示例代码，展示了如何灵活应用 Kafka Connect 进行数据集成，连接多种数据源，实现实时数据流处理，并利用高级特性如Exactly Once语义、数据变换与清洗以及Connector的动态加载，

overfit同步小助手 2023-12-13 21:03:40 0 收藏