大数据 - overfit.cn

zookeeper 都有哪些使用场景？思考1

那么此时就可以使用 zookeeper 分布式锁，一个机器接收到了请求之后先获取 zookeeper 上的一把分布式锁，就是可以去创建一个 znode，接着执行操作；这个其实是 zookeeper 很经典的一个用法，简单来说，就好比，你 A 系统发送个请求到 mq，然后 B 系统消息消费之后处理了。

overfit同步小助手 2024-11-24 14:03:31 0 收藏

大数据新视界 -- Impala 性能突破：处理特殊数据的高级技巧（下）（26 / 30）

本文围绕 Impala 处理特殊数据，阐述稀疏、高精度数据的挑战与对性能影响，介绍其处理技巧、金融和航空等案例，及存储计算平衡、数据一致性兼容性挑战与应对。

overfit同步小助手 2024-11-24 14:03:20 0 收藏

SpringBoot（9）-Dubbo+Zookeeper

①在springboot的配置文件中（application.properties），配置dubbo相关属性。2、IDEA创建一个空项目，创建两个springboot模块，勾选web依赖（分别代表服务提供者和消费者）服务消费者，从提供者地址列表中，基于软负载均衡算法，选一台提供者进行调用，如果调用失

overfit同步小助手 2024-11-24 13:03:35 0 收藏

docker镜像源

【代码】docker镜像源。

overfit同步小助手 2024-11-24 13:03:25 0 收藏

大数据新视界 -- 大数据大厂之 Hive 数据导入：多源数据集成的策略与实战（上）（3/ 30）

本文深度探究 Hive 数据导入，详述多种导入方式与数据格式适配，细析多源集成策略（含整合模式、清洗转换），佐以影视娱乐与电商行业实例、丰富代码及深度分析，为多源数据入 Hive 提供详尽指引并设互动环节，同时预告后续篇章。

overfit同步小助手 2024-11-24 12:03:26 0 收藏

[实时计算flink]双流JOIN语句

Flink SQL支持对动态表进行复杂而灵活的连接操作，本文为您介绍如何使用双流JOIN语句。实时计算的JOIN和传统批处理JOIN的语义一致，都用于将两张表关联起来。区别为实时计算关联的是两张动态表，关联的结果也会动态更新，以保证最终结果和批处理结果一致。

overfit同步小助手 2024-11-24 09:03:56 0 收藏

大数据-228 离线数仓 - Flume 自定义拦截器(续接上节) 编写代码日志采集小结

在 Apache Flume 中，拦截器（Interceptor）是数据流管道的一个关键组件，它允许在事件（Event）进入 Flume Channel 之前对其进行修改或过滤。通过自定义拦截器，你可以实现特定的业务逻辑，如数据过滤、字段添加或修改、格式转换等。自定义拦截器是指用户根据需求自行编写

overfit同步小助手 2024-11-24 08:03:37 0 收藏

[RabbitMQ] 保证消息可靠性的三大机制------消息确认,持久化,发送方确认

🏵️热门专栏:🧊 Java基本语法(97平均质量分)🍕 Collection与数据结构 (92平均质量分)🧀线程与网络(96平均质量分)🍭MySql数据库(93平均质量分)🍬算法(97平均质量分)🍃 Spring(97平均质量分)🎃Redis(97平均质量分)🐰RabbitMQ(9

overfit同步小助手 2024-11-24 08:03:20 0 收藏

面试题：RabbitMQ（一）

1. RabbitMQ如何保证消息不丢失？2. RabbitMQ如何解决消息重复消费问题？3. 死信交换机4. TTL5. RabbitMQ中死信交换机 ? (RabbitMQ延迟队列有了解过嘛)6. RabbitMQ如果有100万消息堆积在MQ , 如何解决(消息堆积怎么解决)7. RabbitM

overfit同步小助手 2024-11-24 06:03:47 0 收藏

利用 Vector 将 Kafka 中的日志数据高效写入 GreptimeDB

Kafka 是一个分布式消息队列，具有高吞吐量、高可靠性、高可扩展性等特点。而GreptimeDB 是一个开源的时序数据库，专门用于存储时间序列数据。本文将介绍如何利用 Vector 从 Kafka 读取日志数据并写入GreptimeDB。

overfit同步小助手 2024-11-24 05:03:47 0 收藏

【微服务】认识微服务及Eureka注册中心

本篇文章主要介绍了微服务的发展里程碑，以及如何使用 eureka，最后记录 ribbon 是如何选取服务对象的

overfit同步小助手 2024-11-24 04:03:43 0 收藏

大数据-227 离线数仓 - Flume 自定义拦截器(续接上节) 采集启动日志和事件日志

（续接上节，上节已经到了打包的部分）# 配置文件滚动方式（文件大小32M）# 向hdfs上刷新的event的个数# 使用本地时间内容的截图如下所示：给source增加自定义拦截器去掉时间戳 a1.sinks.k1.hdfs.useLocalTimeStamp = true根据header中的logt

overfit同步小助手 2024-11-24 02:03:22 0 收藏

spark-libFM 项目常见问题解决方案

spark-libFM 项目常见问题解决方案 spark-libFM An implement of Factorization Machines (LibFM)

overfit同步小助手 2024-11-24 00:03:47 0 收藏

基于大数据 Python NBA球员数据分析系统(源码+LW+部署讲解+数据库+ppt)

随着NBA赛事的日益激烈和球迷对球员数据分析需求的增加，一个功能全面、用户友好的基于大数据平台的NBA球员数据分析系统应运而生。该系统旨在提供球员表现评估、比赛策略分析以及球队管理建议等服务，同时帮助教练、球探和球迷做出更加明智的决策。通过本项目的实施，目标是解决传统篮球分析中存在的数据分散、信息不

overfit同步小助手 2024-11-24 00:03:42 0 收藏

开源项目Facebook Archive的Python-Instagram客户端常见问题解答

开源项目Facebook Archive的Python-Instagram客户端常见问题解答 python-instagram Python Client for Instagram API

overfit同步小助手 2024-11-23 23:03:35 0 收藏

Spark中的DataFrame和DataSet有什么区别？

DataFrame：适用于需要快速编写和维护的数据处理任务，适合初学者或对类型安全要求不高的场景。DataSet：适用于需要类型安全和复杂数据处理任务，适合需要严格类型检查的场景。在实际应用中，可以根据具体需求选择使用 DataFrame 或 DataSet。大多数情况下，DataFrame 和 D

overfit同步小助手 2024-11-23 22:03:56 0 收藏

kafka无法启动，提示连接zookeeper超时

由于/etc/resolv.conf配置了域名服务器的ip，导致kafka连不上zookeeper

overfit同步小助手 2024-11-23 22:03:51 0 收藏

C#与C++交互开发系列（二十一）：跨进程通信之使用RabbitMQ实现消息队列通信

在分布式系统或跨语言系统中，消息队列是一种广泛使用的解决方案，用于在不同系统或程序之间实现异步通信。本文将探讨如何使用RabbitMQ在 C# 和 C++ 程序之间实现跨进程通信。RabbitMQ 是一种高效、可靠的消息代理，支持多种语言客户端，包括 C# 和 C++，能够帮助我们在两个不同的进程间

overfit同步小助手 2024-11-23 21:03:46 0 收藏

Rabbitmq 面试题

通过以上步骤，你可以在 Spring Boot 项目中有效使用 RabbitMQ 的 Virtual Hosts。虚拟主机可以帮助你在同一 RabbitMQ 服务器上隔离不同的应用程序或环境，提升管理灵活性和安全性。特性RabbitMQRocketMQKafka协议AMQP自定义协议（类似于 JMS

overfit同步小助手 2024-11-23 21:03:25 0 收藏

Flink JobManager原理与代码实例讲解

Flink JobManager原理与代码实例讲解关键词Flink JobManager分布式计算调度算法资源管理实践教程摘要

overfit同步小助手 2024-11-23 20:03:46 0 收藏