大数据 - overfit.cn

《Zookeeper 的监听机制及原理解析》

其中，ZooKeeper 的监听机制是其实现分布式协调的关键特性之一，它允许客户端在特定的节点上设置监听器，当节点的数据发生变化或者子节点发生变化时，客户端能够及时收到通知并做出相应的处理。ZooKeeper 的监听机制是其实现分布式协调的关键特性之一，它允许客户端在特定的节点上设置监听器，当节点的

overfit同步小助手 2024-09-15 09:04:06 0 收藏

Spark on Kubernetes Helm 项目教程

Spark on Kubernetes Helm 项目教程 spark-on-kubernetes-helm 项目地址: https://git

overfit同步小助手 2024-09-15 09:03:53 0 收藏

大数据新视界 --大数据大厂之HBase深度探寻：大规模数据存储与查询的卓越方案

本文深入探讨 HBase 在大数据领域的卓越表现。涵盖与其他技术对比、性能优势及调整方法、常见性能问题与解决办法、广泛应用领域及对不同受众群体的意义。通过实际案例和代码示例，详细阐述 HBase 的可扩展性、高可靠性、高并发读写等优势，以及应对读写性能、存储、集群管理和查询不稳定等问题的策略。适用于

overfit同步小助手 2024-09-15 09:03:37 0 收藏

为什么需要电脑监控？

在企业管理中，电脑监控软件逐渐成为提升工作效率和保障信息安全的关键工具。随着远程办公的普及和信息安全的重要性日益提升，越来越多的企业开始重视对员工电脑活动的监控。本文将探讨电脑监控的必要性和实施过程中的一些关键考量。固信软件。

overfit同步小助手 2024-09-15 07:03:26 0 收藏

数据湖hudi技术详解

Hudi数据模型Hudi将数据分为三个层次：文件（File）、记录（Record）和时间线（Timeline）。文件（File）：文件是存储在HDFS上的数据单元，包含了一组记录。每个文件都有一个唯一的文件ID，用于标识文件。文件可以追加数据记录，也可以被删除。记录（Record）：记录是文件的最小

overfit同步小助手 2024-09-15 05:03:45 0 收藏

基于Node.js+vue基于大数据的疫情追踪系统的设计和实现(开题+程序+论文) 计算机毕业设计

基于大数据的疫情追踪系统能够实时收集、整合并分析来自多源的数据，包括患者轨迹、医疗资源分布、人群流动等，为疫情防控提供科学决策支持，成为应对疫情挑战的重要工具。通过该系统的应用，为疫情防控提供强有力的技术支持，助力全球抗击疫情。本研究的意义在于，通过设计并实现基于大数据的疫情追踪系统，能够有效提升疫

overfit同步小助手 2024-09-15 03:05:03 0 收藏

Kafka - This server does not host this topic-partition

overfit同步小助手 2024-09-15 03:05:00 0 收藏

Kafka的生产者和消费者机制

当Producer的acks设置为1或-1时，Producer每次发送消息都是需要获取Broker端返回的RecordMetadate的。这个过程就需要两次跨网络请求。如果要保证消息安全，那么对于每个消息，这两次网络请求就必须要求是幂等的。但是，网络是不靠谱的，在高并发场景下，往往没办法保证这两个请

overfit同步小助手 2024-09-15 01:03:43 0 收藏

大数据技术——DolphinScheduler的集群部署

Apache DolphinScheduler是一个分布式、易扩展的可视化DAG工作流任务调度平台。致力于解决数据处理流程中错综复杂的依赖关系，使调度系统在数据处理流程中开箱即用。工作流要求：工作流需包含三个Shell类型的任务节点，分别是A，B，C。1）创建工作流2）配置任务节点（1）节点A（2）

overfit同步小助手 2024-09-15 01:03:32 0 收藏

Centos7安装RabbitMQ

也可以去Erlang官网下载Erlang存储库https://packagecloud.io/rabbitmq/erlang?page=1，将下载好的rpm包防至Centos上。也可以直接去GitHub上下载https://www.rabbitmq.com/download.html，将下载好的rp

overfit同步小助手 2024-09-15 00:03:46 0 收藏

《基于 Spark 的平替药品智能推荐方法》

本篇文章将介绍，基于 Kafka + Spark + Redis 等技术，在药品开单的过程中，实现一种智能推荐平替药品的方案。💗 后续会逐步分享企业实际开发中的实战经验，有需要交流的可以联系博主。

overfit同步小助手 2024-09-14 22:03:46 0 收藏

RabbitMQ 的事务消息了解吗【RabbitMQ 事务消息实战】

我们知道 RabbitMQ 保证消息一定会发送成功，一般有两种方式，分别是 Publisher Confirm 机制和事务消息，上一篇我们分享了如果使用 RabbitMQ Publisher Confirm 机制来保证消息一定发送成功，本篇我们来分享使用 RabbitMQ 事务消息保证消息一定会

overfit同步小助手 2024-09-14 22:03:40 0 收藏

SFI-HBase一种基于二分空间填充曲线的HBase多维索引（小论文）

针对这一问题，本文从线性化方法入手，使用Z曲线等支持二分划分的空间填充曲线混合理论性质优良的其他空间填充曲线，提出一种新的二分混合空间填充曲线，不仅能够支持二分划分裁剪多维数据空间，并且拥有更好的局部性、聚集度。基于HBase自身存储的二级索引：ITHBase[4]和IHBase[5]出现在HBas

overfit同步小助手 2024-09-14 22:03:19 0 收藏

大数据与云计算：塑造未来的核心驱动力

随着数据量的不断增加和数据处理的复杂化，如何确保数据的安全性和隐私性成为了一个亟待解决的问题。通过数据分析和机器学习等技术手段，大数据和云计算将支持更加智能化、自动化的决策和服务模式的发展。它们不仅推动了科技的进步和产业的升级，也深刻影响了人们的生活方式和社会经济的发展。未来随着技术的不断发展和应用

overfit同步小助手 2024-09-14 21:03:45 0 收藏

Flink Spectator 框架使用指南

Flink Spectator 框架使用指南 flink-spectorFramework for Apache Flink unit tests项目地址:https://gitcode.com/gh_mirrors/fl/flink-spector 项目介绍Flink Spectator 是一个专

overfit同步小助手 2024-09-14 20:03:53 0 收藏

初级练习[1]:Hive数据环境搭建与SQL查询实战

【代码】Hive数据环境搭建与SQL查询实战。

overfit同步小助手 2024-09-14 20:03:49 0 收藏

Kafka 分布式消息系统详细介绍

overfit同步小助手 2024-09-14 20:03:33 0 收藏

基于ssm的林木生长管理系统

1.背景介绍在我们的日常生活中，森林资源的管理和保护是一个重要的环保议题。为了有效地管理森林资源，许多科研机构和政府部门正在寻找更高效的技术手段。这就是我们今天要讨论的主题：基于SSM的林木生长管理系统。SSM是Spring MVC、Spring和MyBatis三个开源框架的缩写。这三个框架在Jav

overfit同步小助手 2024-09-14 16:03:47 0 收藏

【RabbitMQ】工作模式

对RabbitMQ工作模式的简单概述以及代码案例

overfit同步小助手 2024-09-14 16:03:18 0 收藏

搭建大型分布式服务（四十四）SpringBoot 无代码侵入实现多Kafka数据源：单分区提升至十万级消费速度！

在过去的一段时间里，我们利用了AI大模型写了一个多线程并发框架，那么，我们怎样集成到Kafka组件里，让消费速度提升N倍呢？《AI大模型编写多线程并发框架（六十一）：从零开始搭建框架》《AI大模型编写多线程并发框架（六十二）：限流和并发度优化》《AI大模型编写多线程并发框架（六十三）：监听器优化·上

overfit同步小助手 2024-09-14 15:03:19 0 收藏