分布式 - overfit.cn

LLM时代中的分布式AI

深度学习相较传统机器学习模型，对算力有更高的要求。尤其是随着深度学习的飞速发展，模型体量也不断增长。于是，前几年，我们看到了芯片行业的百家争鸣和性能指标的快速提升。正当大家觉得算力问题已经得到较大程度的缓解时，大语言模型（LLM, Large language model）的兴起又带来了前所未有的挑

overfit同步小助手 2023-11-07 21:01:08 0 收藏

Zookeeper-JavaApI操作

Curator 是 Apache ZooKeeper 的Java客户端库。原生Java APIZkClientCuratorCurator 项目的目标是简化 ZooKeeper 客户端的使用。Curator 最初是 Netfix 研发的,后来捐献了 Apache 基金会,目前是 Apache 的顶级

overfit同步小助手 2023-11-07 12:03:49 0 收藏

深入理解 Kafka 的 offset、 leo、hw、epoch 概念

Kafka 作为一个分布式的消息中间件，在高性能、高并发、高可用上有杰出的表现，在数据一致性上更是做出了诸多努力

overfit同步小助手 2023-11-07 11:03:43 0 收藏

Hadoop 分布式集群搭建教程（2023在校生踩坑版）

在Hadoop01节点上执行以下命令，启动HDFS和YARN：bug1：如果出现类似报错。

overfit同步小助手 2023-11-07 01:04:42 0 收藏

spark相关网站

矢量线八方向和全方向栅格化算法C#实现。GIS中将矢量数据转换栅格数据算法。Spark的五种JOIN策略解析。

overfit同步小助手 2023-11-06 23:03:44 0 收藏

Kafka - 异步/同步发送API

该方法有两个参数分别是RecordMetadata（元数据信息）和Exception（异常信息）。回调函数callback（）会在producer收到ack时调用，为异步调用。需求：创建Kafka生产者，采用异步的方式发送到Kafka broker。同步发送的意思就是，一条消息发送之后，会阻塞当前线

overfit同步小助手 2023-11-06 22:03:08 0 收藏

Spring Boot 3 整合 xxl-job 实现分布式定时任务调度，结合 Docker 容器化部署（图文指南）

本文将以实战的方式，教你如何在 Docker 环境下部署 xxl-job，并将其与 Spring Boot 进行整合。我们将从简单介绍 xxl-job 的基本概念和特点开始，然后详细讲解如何配置调度器任务、开启任务，并调用执行器执行任务。通过本文的学习，你将能够快速上手并使用 xxl-job 实现任

overfit同步小助手 2023-11-06 08:04:49 0 收藏

分享8个分布式Kafka的使用场景

Kafka 最初是为海量日志处理而构建的。它保留消息直到过期，并让消费者按照自己的节奏提取消息。与它的前辈不同，Kafka 不仅仅是一个消息队列，它还是一个适用于各种情况的开源事件流平台。

overfit同步小助手 2023-11-06 06:03:18 0 收藏

分布式数据库Apache Doris HA集群部署

Apache Doris实在火的不得了，基于开源的这个分布式数据库HA集群，我们开启体验之旅。

overfit同步小助手 2023-11-06 05:06:19 0 收藏

RabbitMQ使用详解

RabbitMQ单机安装 RabbitMQ消息模型：基本消息队列、工作消息队列、发布订阅（Fanout、Direct、Topic） RabbitMQ集群部署 RabbitMQ生产者消息确认 RabbitMQ消费者消息确认 RabbitMQ消息失败重试机制 RabbitMQ死信交换机 RabbitMQ

overfit同步小助手 2023-11-05 22:03:32 0 收藏

【大数据】图解 Hadoop 生态系统及其组件

HDFS是 Hadoop 的分布式文件系统，旨在在廉价硬件上存储大型文件。它具有高度容错能力，并为应用程序提供高吞吐量。 HDFS 最适合那些拥有非常大数据集的应用程序。Hadoop HDFS 文件系统提供 Master 和 Slave 架构。主节点运行 Namenode 守护进程，从节点运行 Da

overfit同步小助手 2023-11-05 11:03:31 0 收藏

Zabbix第二部分：基于Proxy分布式部署实现Web监控和Zabbix HA集群的搭建

zabbix-proxy和zabbix HA

overfit同步小助手 2023-11-05 10:03:08 0 收藏

Kafka中的生产者如何处理消息发送失败的情况？

通过以上方式，开发者可以对Kafka生产者的消息发送过程进行处理和管理，根据不同的失败情况采取相应的策略，确保消息发送的可靠性和稳定性。请根据具体的需求和业务场景选择适合的处理方式。

overfit同步小助手 2023-11-05 05:03:18 0 收藏

Spark中的Driver、Executor、Stage、TaskSet、DAGScheduler等介绍

在 Spark 中，有多个概念和组件相互协作，以实现分布式数据处理。如有错误，欢迎指出！如有错误，欢迎指出！如有错误，欢迎指出！

overfit同步小助手 2023-11-04 22:03:48 0 收藏

大数据开源框架环境搭建(四)——HDFS完全分布式集群的安装部署

普通用户下大部分命令需要加sudo，root模式下不用。如果怕麻烦，直接在root用户下操作。本框架的分布式集群如下图所示(IP地址不一定跟图中一样)

overfit同步小助手 2023-11-04 21:03:38 0 收藏

【Redis】高并发分布式结构服务器

overfit同步小助手 2023-11-04 20:02:04 0 收藏

Kafka数据清理指南

在本文中，我们将介绍如何使用Kafka进行数据清理。当我们在Kafka集群中处理大量的数据时，及时清理过期、无效或不再需要的数据是非常重要的。首先，我们需要了解Kafka中的数据保留策略。Kafka的数据保留策略决定了消息在主题中保留的时间。默认情况下，Kafka会根据时间来保留数据，也可以根据数据

overfit同步小助手 2023-11-04 08:03:34 0 收藏

kafka详解(三)

1）查看操作主题命令参数2）查看当前服务器中的所有topic (配置了环境变量不需要写bin/)4）查看first主题的详情5）修改分区数（6）再次查看first主题的详情7）删除topic。

overfit同步小助手 2023-11-04 08:03:12 0 收藏

聊聊分布式架构08——SpringBoot开启微服务时代

聊聊分布式架构——SpringBoot开启微服务时代

overfit同步小助手 2023-11-04 06:02:05 0 收藏

Hadoop YARN功能介绍--资源管理、调度任务

YARN是一个通用资源管理系统平台和调度平台，可为上层应用提供统一的资源管理和调度。他的引入为集群在利用率、资源统一管理和数据共享等方面带来了好处。

overfit同步小助手 2023-11-03 23:02:57 0 收藏