分布式 - overfit.cn

如何在生产环境中以非 Root 用户启动 Kafka

在生产环境中以非 root 用户启动 Kafka 是一个最佳实践，能够有效提高系统安全性。创建并配置 Kafka 用户。设置目录权限确保 Kafka 用户可以访问必要的文件和目录。修改 systemd 服务文件，使 Kafka 服务以 Kafka 用户启动。启动和验证 Kafka 服务，确保配置正确

overfit同步小助手 2024-05-31 13:03:43 0 收藏

kafka的简单使用

overfit同步小助手 2024-05-31 05:03:40 0 收藏

【Gluten】Spark 的向量化执行引擎框架 Gluten

Gluten 项目主要用于“粘合” Apache Spark 和作为 Backend 的 Native Vectorized Engine。Backend 的选项有很多，目前在 Gluten 项目中已经明确开始支持的有 Velox、Clickhouse 和 Apache Arrow。通过使用Nati

overfit同步小助手 2024-05-31 01:04:05 0 收藏

Kafka 面试八股题整理

本文是博主自行收集的Kafka相关的八股文问题，博主还在准备暑期实习中，应该会持续更新....

overfit同步小助手 2024-05-30 23:03:20 0 收藏

实战：RabbitMQ的分布式事务处理

1.背景介绍分布式事务处理是一种在多个节点之间处理事务的方法，它可以确保在分布式系统中的多个节点之间的事务处理的一致性和完整性。在分布式系统中，事务可能涉及多个节点，这使得事务处理变得复杂。因此，分布式事务处理是一项重要的技术，它可以确保在分布式系统中的事务处理的一致性和完整性。RabbitMQ是一

overfit同步小助手 2024-05-30 21:03:59 0 收藏

Spark-RDD / DataFrame

1、：你可以使用方法从一个已有的 Scala 集合（如数组或列表）中创建。：你可以使用 Spark 提供的各种数据源来创建 RDD，比如文本文件、序列文件、JSON 文件、CSV 文件等。：你可以通过对已有的 RDD 进行各种转换操作来创建新的 RDD。

overfit同步小助手 2024-05-30 16:03:29 0 收藏

中间件之异步通讯组件RabbitMQ进阶

一般情况下，只要生产者与MQ之间的网路连接顺畅，基本不会出现发送消息丢失的情况，因此大多数情况下我们无需考虑这种问题。不过，在少数情况下，也会出现消息发送到MQ之后丢失的现象，比如：MQ内部处理消息的进程发生了异常生产者发送消息到达MQ后未找到Exchange生产者发送消息到达MQ的Exchange

overfit同步小助手 2024-05-30 15:03:53 0 收藏

Hadoop3.1.4完全分布式集群搭建

在Centos7中直接使用root用户执行hostnamectl命令修改，重启（reboot）后永久生效。要求：三台主机的名字分别为：master slave1 slave2。

overfit同步小助手 2024-05-30 15:03:46 0 收藏

Kafka VS RabbitMQ，架构师教你如何选择

消息队列在现代软件架构中已经成为不可或缺的中间件，如果你曾经搭建过系统服务需要用到消息中间件，一定会思考到底怎么选择呢？消息队列的主要功能如下：解耦、异步、扩展性、流量削峰、顺序保障、缓存等。处于某种原因，在大多数场景中 Kafka 和 RabbitMQ 是可以互换的，很多程序员可能都这么认为，这篇

overfit同步小助手 2024-05-30 11:03:49 0 收藏

消息中间件Kafka（PHP版本）

Kafka是由Apache软件基金会开发的一个开源流处理平台，由Scala和Java编写。Kafka是一种高吞吐量的分布式发布订阅消息系统，它可以处理消费者在网站中的所有动作流数据。这种动作（网页浏览，搜索和其他用户的行动）是在现代网络上的许多社会功能的一个关键因素。这些数据通常是由于吞吐量的要

overfit同步小助手 2024-05-30 10:03:56 0 收藏

zookeeper之分布式环境搭建

ZooKeeper的分布式环境搭建是一个涉及多个步骤的过程，主要包括准备工作、安装ZooKeeper、配置集群、启动服务以及验证集群状态。

overfit同步小助手 2024-05-30 10:03:47 0 收藏

Python 简单使用 RabbitMQ

执行后我们进入rabbitMQ网页端后台查看pythone.test 队列已经被创建。并且我们执行了三次，此处产生3条数据未被消费，还被压在队列中。我们执行3次product方法，生产3条数据到队列。再查看rabbitMQ网页后台，发现消息已经被正常消费。再执行consumer方法，对队列内数据进

overfit同步小助手 2024-05-30 10:03:17 0 收藏

【大数据】Hadoop 2.X和1.X升级优化对比

一文详解hadoop 2.X版本对于1.X版本做出的优化和升级

overfit同步小助手 2024-05-30 08:03:44 0 收藏

Kafka指定分区消费及consumer-id,client-id相关概念解析_kafka clientid

在最近使用Kafka过程中，发现使用@KafkaListener指定分区消费时（指定了所有分区），如果服务是多节点，会出现重复消费的现象，即两个服务节点中的消费者均会消费到相同信息，这与消费者组中只有一个消费者可以消费到消息的规则不相符，于是花时间找了找原因Consumer 机制小龙虾你抓不到(上面

overfit同步小助手 2024-05-30 06:03:19 0 收藏

实验四 Spark Streaming编程初级实践

数据流：数据流通常被视为一个随时间延续而无限增长的动态数据集合，是一组顺序、大量、快速、连续到达的数据序列。通过对流数据处理，可以进行卫星云图监测、股市走向分析、网络攻击判断、传感器实时信号分析。

overfit同步小助手 2024-05-30 05:04:01 0 收藏

RabbitMQ介绍+使用手册

RabbitMQ在window下的使用方法。

overfit同步小助手 2024-05-30 05:03:50 0 收藏

Apache Seata如何解决TCC 模式的幂等、悬挂和空回滚问题

overfit同步小助手 2024-05-30 04:06:11 0 收藏

kafka监控配置和告警配置

Kafka的监控配置和告警配置是确保Kafka集群稳定运行的关键部分。以下是一些关于Kafka监控配置和告警配置的建议：一、Kafka监控配置二、Kafka告警配置关于Kafka的监控配置和告警配置的详细操作步骤如下：修改Kafka配置文件：还可以设置JMX（Java Management Exte

overfit同步小助手 2024-05-30 03:03:54 0 收藏

hadoop报错：HADOOP_HOME and hadoop.home.dir are unset. 解决方法

1.下载apache-hadoop-3.1.0-winutils-master。

overfit同步小助手 2024-05-30 03:03:49 0 收藏

Spark中方法运用

spark.read的具体操作，在创建Dataframe之前，为了支持RDD转换成Dataframe及后续的SQL操作，需要导入import.spark.implicits._包启用隐式转换。Spark SQL是Spark用来处理结构化数据的一个模块，它提供了一个编程抽象结构叫做DataFrame的

overfit同步小助手 2024-05-29 23:04:05 0 收藏