大数据 - overfit.cn

【运维】Kafka高可用： KRaft（不依赖zookeeper）集群搭建

>本文主要介绍了>- kafka raft集群架构：> 与旧架构的不同点，有哪些优势，哪些问题> 架构成员有哪些，怎么规划。> - 三节点集群安装、启动与测试

overfit同步小助手 2024-01-21 07:03:44 0 收藏

Kafka生产环境问题总结与性能优化实践

实现延时队列的思路是将消息按照不同的延迟时间发送到不同的队列（例如，topic_1s、topic_5s、topic_10s等），然后通过定时器轮询这些队列，检查消息是否到期，如果到期就将其发送到具体的业务处理主题中。这可能导致消息乱序的情况，例如，发送了1、2、3三条消息，第一条超时，后两条成功，然

overfit同步小助手 2024-01-21 06:03:51 0 收藏

【hive】Hive中的大宽表及其底层详细技术点

通过选择合适的存储格式、数据分区、列式存储和压缩、列存储索引、数据分桶等底层技术点，可以有效地管理和处理大量列的数据表格。在Hive中，可以选择不同的存储格式来存储大宽表，如文本格式、序列文件格式、列式存储格式等。为了满足这种需求，Hive引入了大宽表（Large Wide Table）的概念，它是

overfit同步小助手 2024-01-21 06:03:48 0 收藏

MFC - CArchive/内存之间的序列化应用细节

有个参数文件, 开始直接序列化到文件.现在优化程序, 不想这个参数文件被用户看到.想先由参数发布程序(自己用)设置好参数后, 加个密落地.等用户拿到后, 由程序导入到程序运行时指定的数据目录.程序运行时, 先解密参数文件到内存, 然后再由MFC序列化到类中的变量.查了一下, 有大神出了文章(), 将

overfit同步小助手 2024-01-21 06:03:30 0 收藏

第四章 Spring Cloud Netflix 之 Eureka

Eureka 是 Netflix 公司开发的一款开源的服务注册与发现组件。Spring Cloud 使用 Spring Boot 思想为 Eureka 增加了自动化配置，开发人员只需要引入相关依赖和注解，就能将 Spring Boot 构建的微服务轻松地与 Eureka 进行整合。

overfit同步小助手 2024-01-21 05:03:44 0 收藏

第一章 Kafka 配置部署及SASL_PLAINTEXT安全认证

执行启动 Zookeeper 命令。执行启动 Kafka 命令。

overfit同步小助手 2024-01-21 03:03:51 0 收藏

AnalyticDB for PostgreSQL 实时数据仓库上手指南

AnalyticDB for PostgreSQL 提供企业级数据仓库云服务，基于开源Greenplum构建，采用MPP架构，支持1000+节点PB级数据的实时分析。通过数据传输服务 DTS 、数据集成工具DataX、开源同步工具 rds_dbsync 、 Kettle 等，同步交易库数据到 AD

overfit同步小助手 2024-01-21 03:03:42 0 收藏

Hadoop3.3.5云耀云服务器安装教程-单机/伪分布式配置

以上就是对hadoop在云服务器上的部署，若有问题可留言。

overfit同步小助手 2024-01-21 03:03:13 0 收藏

Hive内核调优(二)

SQL调优过程中需要结合Hive日志分析性能瓶颈，如下是对关键日志进行说明。

overfit同步小助手 2024-01-21 03:03:09 0 收藏

Hive实战：分科汇总求月考平均分

本次实战运用Hive处理学生月考成绩数据，通过创建分区表、加载各科目成绩至对应分区，并使用SQL语句计算平均分，展示了Hive在大数据管理、分析查询及统计计算上的灵活性与便捷性。

overfit同步小助手 2024-01-21 02:03:49 0 收藏

Hadoop期末复习试题和答案

期末复习试题

overfit同步小助手 2024-01-21 02:03:34 0 收藏

Canal+Kafka+springboot（成功）

版本（Canal1.1.7）Kafka（kafka_2.12-3.5.1） mysql(8.0)

overfit同步小助手 2024-01-21 02:03:25 0 收藏

spark-sql字段血缘实现

字段血缘

overfit同步小助手 2024-01-21 01:03:27 0 收藏

「Kafka」生产者篇

生产者发送消息流程、生产者分区、生产者如何提高吞吐量、生产者数据可靠性、生产者数据去重、生产者数据有序乱序等。

overfit同步小助手 2024-01-21 00:03:43 0 收藏

消息中间件之RabbitMQ

1.基于AMQP协议Erlang语言开发的一款消息中间件，客户端语言支持比较多，比如Python,Java,Ruby,PHP,JS,Swift.运维简单，灵活路由，但是性能不高，可以满足一般场景下的业务需要,三高场景下吞吐量不高，消息持久化没有采取零拷贝技术，消息堆积时，性能会下降2.消息吞吐量在1

overfit同步小助手 2024-01-21 00:03:40 0 收藏

SpringBoot集成RabbitMQ之ACK确认机制（第三节）

ACK机制能够确保消息的【可靠性】，消费者失败了，如何处理，成功了又如何处理，本文章介绍了消费者端确认模式，生产者确认模式

overfit同步小助手 2024-01-21 00:03:08 0 收藏

数据仓库命名规范详解

小时(h)、天（d）、周(w)、月（m）、季（q）、年（y）。实时（rt）、小时（h）、天（d）、周（w）、月（m）、季（q）、年（y）、一次性任务（o）、无周期（n）实时（rt）、小时（h）、天（d）、周（w）、月（m）、季（q）、年（y）、一次性任务（o）、无周期（n）实时（rt）、小时（h）、

overfit同步小助手 2024-01-20 23:03:50 0 收藏

HiveSQL中的分区与分桶

分区与分桶不同点:1.分区是分文件夹,而分桶是分文件 2.分区是避免全表扫描,分桶是方便数据采集,减少join次数相同点:它们的最终目的都是为了提升效率。

overfit同步小助手 2024-01-20 23:03:43 0 收藏

大数据期末考试复习（1-4，7，10章）简答题HNUST

（2）每个块都向HDFS集群中的名称节点发起写请求，名称节点会根据系统中各个数据节点的使用情况，选择一个数据节点列表返回给客户端，然后客户端就将数据首先写入列表中的第一数据节点，同时将列表传给第一个数据节点，当第一个数据节点接收到4KB数据时，写入本地，并且向列表中的第二个数据节点发起连接请求，将自

overfit同步小助手 2024-01-20 23:03:37 0 收藏

超详细版Hadoop的安装与使用（单机/伪分布式）

overfit同步小助手 2024-01-20 23:03:28 0 收藏