大数据 - overfit.cn

kafka复习：（11）auto.offset.reset的默认值

也就是默认值为latest,它的含义是：如果没有客户端提交过offset的话，当新的客户端消费时，把最新的offset设置为当前消费的offset.在ConsumerConfig这个类中定义了这个属性的默认值，如下图。手动提交offset的示例。

overfit同步小助手 2023-09-01 22:04:00 0 收藏

Zookeeper 集群中节点之间数据是如何同步的

1．首先集群启动时，会先进行领导者选举，确定哪个节点是 Leader ，哪些节点是 Follower 和 Observer2．然后 Leader 会和其他节点进行数据同步，采用发送快照和发送 Diff 日志的方式3．集群在工作过程中，所有的写请求都会交给 Leader 节点来进行处理，从节点只能处理

overfit同步小助手 2023-09-01 21:04:50 0 收藏

如何实现延时任务（订单到期关闭）

我们介绍了11种实现订单定时关闭的方案，其中不同的方案各自都有优缺点，也各自适用于不同的场景中。那我们尝试着总结一下：实现的复杂度上（包含用到的框架的依赖及部署）：Redisson > RabbitMQ插件 > RabbitMQ死信队列 > RocketMQ延迟消息 ≈ Redis的zset > R

overfit同步小助手 2023-09-01 21:04:28 0 收藏

CDH6.3.2搭建HIVE ON TEZ

如果内存不够：可以修改如下参数设置。----配置hive运行引擎。

overfit同步小助手 2023-09-01 20:04:29 0 收藏

微服务: 00-rabbitmq出现的异常以及解决方案

1. rabbitmq报您与此网站连接不是私密连接2. Don't forget to grant the user permissions to some virtual hosts! See 'rabbitmqctl help set_permissions' to learn more.3.

overfit同步小助手 2023-09-01 20:04:18 0 收藏

大数据笔记--Spark机器学习（第一篇）

一、数据挖掘与机器学习1、概念2、人工智能3、数据挖掘体系二、机器学习1、什么是机器学习2、机器学习的应用3、实现机器学习算法的工具与技术框架三、Spark MLlib介绍1、简介2、MLlib基本数据类型Ⅰ、概述Ⅱ、本地向量Ⅲ、向量标签的使用Ⅳ、本地矩阵Ⅴ、分布式矩阵的使用3、MLlib统计量基础

overfit同步小助手 2023-09-01 20:04:11 0 收藏

Linux快速安装Erlang和RabbitMQ单机版

RabbitMQ 是一个由 Erlang 语言开发的 AMQP 的开源实现。本文介绍基于Linux CentOS系统的安装方法，通过编译的方法进行安装

overfit同步小助手 2023-09-01 19:04:26 0 收藏

Hbase基础(一)——安装与使用

Hbase是一个分布式的、面向列的开源数据库，有区别于传统的行式数据库(如Mysql等)，与Hive数据仓库相比，更适合实时存储数据场景，但是与传统的列式数据库相比，更适合键值对的数据存取或者有序的数据存取。Hbase的版本有很多，读者在下载Hbase的压缩包之前，先去Hbase官网查看不同版本的h

overfit同步小助手 2023-09-01 16:04:34 0 收藏

RabbitMQ

MQ(message queue)，从字面意思上看，本质是个队列，FIFO 先入先出，只不过队列中存放的内容是message 而已，还是一种跨进程的通信机制，用于上下游传递消息。在互联网架构中，MQ 是一种非常常见的上下游“逻辑解耦+物理解耦”的消息通信服务。使用了 MQ 之后，消息发送上游只需要依

overfit同步小助手 2023-09-01 16:04:28 0 收藏

Spark SQL

新手入门文章

overfit同步小助手 2023-09-01 16:03:42 0 收藏

利用RabbitMQ实现消息投递削峰填谷

实现系统通知模块 - 利用RabbitMQ实现消息投递削峰填谷

overfit同步小助手 2023-09-01 15:04:31 0 收藏

深入解析Eureka和Nacos的区别

Eureka采用CS架构,由服务注册中心Eureka Server和服务提供者/消费者Eureka Client组成。Nacos采用高可用的P2P设计(无主节点),所有的server节点都是同等作用,支持AP和CP两种模式。

overfit同步小助手 2023-09-01 15:04:22 0 收藏

Kafka基础及常见面试题

3. Kafka中Topic的概念。2. Kafka的核心组件。

overfit同步小助手 2023-09-01 13:04:37 0 收藏

Spring Boot 项目应用消息服务器RabbitMQ（简单介绍）

overfit同步小助手 2023-09-01 13:04:27 0 收藏

实战：大数据Spark简介与docker-compose搭建独立集群

Spark是采用分布式数据集RDD对数据进行管理，用内存进行分布式计算，他的性能叫hadoop有显著的提升。对于Spark独立集群的搭建我们用docker容器也是比较的简单，当然，我们也可以集成在springboot开发出适应业务的功能安装需求进行远程提交任务。

overfit同步小助手 2023-09-01 13:04:09 0 收藏

2023_Spark_实验一：Windows中基础环境安装

windows, Java, Scala部署与验证。

overfit同步小助手 2023-09-01 13:03:56 0 收藏

FlinkCDC第三部分-同步mysql到mysql，ctrl就完事~（flink版本1.16.2）

需要注意的是，BEGIN STATEMENT SET 和 COMMIT 语句是 Flink SQL 的扩展语法，它们可能在某些特定的 Flink 版本或环境中才可用。通过设置适当的检查点间隔，可以在容忍一定故障的同时，控制检查点的频率和资源使用。如果在 BEGIN STATEMENT SET 和 C

overfit同步小助手 2023-09-01 12:04:26 0 收藏

Flink 写入 Doris

apache Flink 写入 Apache Doris

overfit同步小助手 2023-09-01 12:04:17 0 收藏

Flink Dashboard的数据监控功能

overfit同步小助手 2023-09-01 11:04:22 0 收藏

kafka架构和原理详解

Kafka 是一个由 Apache 软件基金会开发的分布式流数据平台，用于构建高吞吐量、低延迟的实时数据流处理系统。它最初由 LinkedIn 开发，并在成为开源项目后交给 Apache 维护。Kafka 的设计目标是能够处理大规模的实时数据流，以支持应用程序的实时数据处理、日志收集、事件流处理等需

overfit同步小助手 2023-09-01 09:04:20 0 收藏