大数据 - overfit.cn

22 | Kafka和RocketMQ的消息复制实现的差异点在哪？

这节课我们主要来讲了一下，消息复制需要面临的问题以及 RocketMQ 和 Kafka 都是如何应对这些问题来实现复制的。RocketMQ 提供新、老两种复制方式：传统的主从模式和新的基于 Dledger 的复制方式。传统的主从模式性能更好，但灵活性和可用性稍差，而基于 Dledger 的复制方式，

overfit同步小助手 2024-02-28 07:03:52 0 收藏

RabbitMQ基本概念与数据结构

1.背景介绍RabbitMQ是一种开源的消息代理服务，它使用AMQP(Advanced Message Queuing Protocol，高级消息队列协议)协议来实现消息的传输和处理。RabbitMQ可以帮助开发者在分布式系统中实现高效的消息传递和处理，提高系统的可靠性和可扩展性。消息队列是一种在分

overfit同步小助手 2024-02-28 07:03:24 0 收藏

人工智能=机器学习+大数据

但对于AI程序，程序员只能向模型提供数据，至于模型最终生成的判断逻辑，程序员往往难以完全理解。以AlphaGo为例，虽然它能够击败世界冠军，但其背后的每一步决策逻辑，程序员可能并不清楚，这是因为AlphaGo学习了人类几乎所有的棋谱，并结合自身的算法进行决策。2024年2月，OpenAI继ChatG

overfit同步小助手 2024-02-28 06:03:50 0 收藏

安装配置hive

正确安装Hive；正确配置Hive，理解其配置原理。

overfit同步小助手 2024-02-28 06:03:22 0 收藏

spark内存管理模型

本文主要粗略的介绍了spark使用的两种内存模型

overfit同步小助手 2024-02-28 05:03:32 0 收藏

ZooKeeper教程2

Leader选举：Serverid：服务器ID比如说有三台服务器，编号分别是1,2,3。编号越大在选择算法中的权重越大。Zxid：数据ID服务器中存放的最大数据ID值越大说明数据越新，在选举算法中数据越新，权重越大。在Leader选举的过程中，如果某台zookeeper 获得了超过半数的选票，则

overfit同步小助手 2024-02-28 05:03:13 0 收藏

Rabbitmq入门与应用(六)-rabbitmq的消息确认机制

讲解如何在项目中保证rabbitmq消息传输中的数据一致性问题

overfit同步小助手 2024-02-28 03:03:44 0 收藏

spark基础

spark python java scala

overfit同步小助手 2024-02-28 01:03:34 0 收藏

RabbitMQ与Spring Boot如何集成？

RabbitMQ广泛应用于分布式系统、微服务架构、消息驱动的应用等场景，提供了可靠的消息传递机制，帮助开发者构建可扩展、可靠的应用系统。

overfit同步小助手 2024-02-28 00:03:51 0 收藏

RabbitMQ高可靠性原理解读

2.MQ的可靠性消息到达MQ以后，如果MQ不能及时保存，也会导致消息丢失，所以MQ的可靠性也非常重要。2.1.数据持久化为了提升性能，默认情况下MQ的数据都是在内存存储的临时数据，重启后就会消失。为了保证数据的可靠性，必须配置数据持久化，包括：交换机持久化队列持久化消息持久化我们以控制台界面为例来说

overfit同步小助手 2024-02-28 00:03:46 0 收藏

hive--外部表常用操作全面且详细

在创建表的时候可以指定external关键字创建外部表,外部表对应的文件存储在location指定的hdfs目录下,向该目录添加新文件的同时，该表也会读取到该文件(当然文件格式必须跟表定义的一致)。外部表因为是指定其他的hdfs路径的数据加载到表当中来，所以hive表会认为自己不完全独占这份数据，所

overfit同步小助手 2024-02-28 00:03:24 0 收藏

Kafka的ACK应答级别

在 Kafka 中，ACK（Acknowledgement）应答级别是一个重要的概念，它决定了消息发送到 Kafka 集群后如何确认消息的成功存储。生产者可以根据需要设置不同的 ACK 级别，以在数据可靠性和传输效率之间做出权衡。选择哪个 ACK 级别取决于具体的应用场景和对数据可靠性与处理吞吐量的

overfit同步小助手 2024-02-27 21:03:44 0 收藏

Kafka消息流转的挑战与对策：消息丢失与重复消费问题

这一节关于kafka消息中间件出现重复消费和消息丢失的场景和原因进行了分析，你学会了吗？

overfit同步小助手 2024-02-27 21:03:27 0 收藏

基于大数据的淘宝电子产品数据分析的设计与实现

（2）框架可以帮助程序开发者快速构建软件的整体层次，本次开发所使用的框架为python和Django，具有较强的开发环境部署的优势，程序开发者可以快速构建出相关的软件基本框架，通过多种框架的开发可以帮助程序开发者减少代码量，提升系统的安全和稳定性，能够帮助大数据的淘宝电子产品数据分析功能模块的处理[

overfit同步小助手 2024-02-27 20:03:53 0 收藏

架构设计内容分享(二百一十)：设计一个大并发、大数据的系统架构，说说设计思路

也就是说，一个类应该对自己需要耦合或调用的类知道的最少，类与类之间的关系越密切，耦合度越大，那么类的变化对其耦合的类的影响也会越大，这也是我们面向对象设计的核心原则：低耦合，高内聚。优秀的架构和产品都是一步一步迭代出来的，用户量的不断增大，业务的扩展进行不断地迭代升级，最终演化成优秀的架构。其根本思

overfit同步小助手 2024-02-27 20:03:50 0 收藏

数据仓库概念梳理

上面雪花模型中，学生信息事实表的orderId还继续关联了下一个层级体验课记录表，体验课报名记录表还可能会继续往下关联，对于复杂的系统而言，一般会采用雪花模型，关键层级会较多，而星型模型的关联过于单一，层级不够深，无法支持这种操作。一个维表会对应多个事实表，而维表和事实表所有关联起来就形成一个宽表，

overfit同步小助手 2024-02-27 20:03:42 0 收藏

通过kafka学习数据一致性

Kafka通过分区与副本机制、ISR机制、消息提交确认、原子性操作和容错处理等手段，确保数据一致性。这些设计使得Kafka能够在分布式环境中实现高吞吐量、持久化存储、可扩展性和高可靠性等特性从而满足各种复杂场景下的数据一致性需求。

overfit同步小助手 2024-02-27 20:03:10 0 收藏

Apache Doris 整合 FLINK CDC + Iceberg 构建实时湖仓一体的联邦查询

自此我们完整从搭建Hadoop，hive、flink 、Mysql、Doris 及Doris On Iceberg的使用全部介绍完了，Doris朝着数据仓库和数据融合的架构演进，支持湖仓一体的联邦查询，给我们的开发带来更多的便利，更高效的开发，省去了很多数据同步的繁琐工作。上述Doris On Ic

overfit同步小助手 2024-02-27 19:04:00 0 收藏

RabbitMQ

基本消息队列的消息发送流程：建立connection创建channel利用channel声明队列利用channel向队列发送消息基本消息队列的消息接收流程：建立connection创建channel利用channel声明队列定义consumer的消费行为handleDelivery()利用chann

overfit同步小助手 2024-02-27 17:03:39 0 收藏

Kafka_04_Topic和日志

Topic和日志

overfit同步小助手 2024-02-27 17:03:31 0 收藏