大数据 - overfit.cn

【消息队列】RabbitMQ实现消费者组机制

发送消息到交换机，交换机会自动分发给所有绑定到它的队列，也就是发送一条消息至 exchange_user 交换机，那么消息会被投递给队列 exchange_user_consumer_user_rpc 和队列 exchange_user_consumer_org_rpc。在生产者初始化时，需要先将

overfit同步小助手 2024-11-01 23:03:16 0 收藏

Hive和Hbase的区别

特性HiveHBase数据模型类似 RDBMS，使用表结构NoSQL，基于列的稀疏表存储方式基于 HDFS，数据以文件存储基于 HDFS，列存储查询语言Java API，支持 SQL-like 查询适用场景批处理、大规模数据分析实时数据访问、随机读写数据更新不支持频繁更新，只适合批处理支持频繁读写和

overfit同步小助手 2024-11-01 21:03:53 0 收藏

【计算机毕设-大数据方向】基于Hadoop的智能交通数据分析可视化系统的设计与实现

在当今社会，随着城市化进程的不断加速，交通问题日益成为制约城市发展的重要因素之一。特别是在一些大中型城市中，交通拥堵不仅影响了人们的出行效率，还带来了环境污染、能源浪费等一系列连锁反应。因此，如何有效地解决交通问题，提高交通系统的智能化水平，成为了研究的重要课题。在此背景下，“基于Hadoop的智能

overfit同步小助手 2024-11-01 21:03:46 0 收藏

大数据-Hadoop-基础篇-第四章-HDFS（分布式文件存储）

使用 get 命令可以将 HDFS 文件系统中的文件下载到本地,注意下载时的文件名不能与本地文件相同，否则会提示文件已经存在。使用 appendToFie 命令可以将单个或多个文件的内容从本地系统追加到 HDFS 系统的文件中。例如,将本地文件a.txt移动到HDFS的/imnput 文件夹中,命令

overfit同步小助手 2024-11-01 21:03:43 0 收藏

springcloud之服务提供与负载均衡调用 Eureka

服务提供者Service Provider 本质上是一个 Eureka Client，它在服务启动时，会调用服务注册方法，向 Eureka Server注册接口服务信息，包括地址、端口、服务名、入参、返回值等。4：服务提供方，作为一个 Eureka Client，向 Eureka Server 做服

overfit同步小助手 2024-11-01 21:03:30 0 收藏

RabbitMQ中，如何监控和管理队列的性能和状态？

RabbitMQ 提供了多种工具和方法来监控和管理队列的性能和状态。这些工具可以帮助你了解 RabbitMQ 服务器的状态、队列的消息流量、资源使用情况等，从而优化系统性能并确保其稳定运行。

overfit同步小助手 2024-11-01 20:03:49 0 收藏

毕设项目基于大数据的游数据分析可视化系统(源码分享)

今天学长向大家分享一个毕业设计项目毕业设计基于大数据的游数据分析可视化系统(源码分享)演示效果毕业设计大同旅游数据分析可视化系统🧿 项目分享:见文末!数据可视化是数据处理中的重要部分Django是一个基于Web的应用框架，由python编写。Web开发的基础是B/S架构，它通过前后端配合，将后

overfit同步小助手 2024-11-01 19:03:46 0 收藏

大数据Hive安装与配置

Hive 是一个构建在 Hadoop 之上的数据仓库工具，用于数据的提取、转换和加载（ETL），并提供了一种类 SQL 的查询语言（HiveQL），使用户能够轻松查询和分析大规模数据集。

overfit同步小助手 2024-11-01 19:03:22 0 收藏

【赵渝强老师】基于ZooKeeper实现Hadoop HA

图14.9一共使用了4个节点来部署HDFS HA，它们分别是：bigdata112、bigdata113、bigdata114和bigdata115。（12）将bigdata112上$HADOOP_HOME/tmp拷贝到bigdata113的对应目录下。（9）在bigdata112、bigdata1

overfit同步小助手 2024-11-01 17:04:52 0 收藏

Zookeeper+消息队列（kafka）

Zookeeper 是一个分布式协调服务，专门为分布式应用提供高效可靠的协调、同步、配置管理和故障恢复等功能。它的设计目的是简化分布式系统的管理，保证多个节点之间的数据一致性和协调工作。Zookeeper 提供了类似文件系统的层次化命名空间，用来存储和管理元数据，确保分布式应用的高可用性和强一

overfit同步小助手 2024-11-01 16:03:33 0 收藏

数据湖与数据仓库

数据仓库是传统的数据存储方式，其核心概念是将不同来源的数据抽取、转化和加载到一个中心化的存储系统中，供企业进行决策分析使用。数据仓库通过预定义的模式和结构化的数据模型，使得数据易于理解和查询分析。如果企业有明确的分析要求，并且数据结构稳定且易于理解数据仓库是一个不错的选择。数据仓库是从广泛的运营和外

overfit同步小助手 2024-11-01 16:03:28 0 收藏

备战大数据比赛：个人经验与实战技巧分享

备战大数据比赛：个人经验与实战技巧分享【安徽省大数据与人工智能应用竞赛】

overfit同步小助手 2024-11-01 15:03:36 0 收藏

数据仓库建设：主题域简介

在数据仓库建设中，主题域是数据模型的一个重要概念，它帮助构建逻辑清晰、层次分明的数据结构。主题域的设计基于企业的业务结构，将业务中的关键部分提炼出来，划分为若干个主题域。每个主题域对应一个特定的业务领域，便于组织、存储和分析业务数据。

overfit同步小助手 2024-11-01 14:03:53 0 收藏

kafka-clients之mq丢失问题

客户端版本为2.6.x，客户端机器可能在尝试连接 Kafka broker 时因为超时断开，导致无法成功接收或更新 metadata由于客户端没有及时感知到broker重新选举的metadata数据，一直尝试向宕机的broker发送mq，在2分钟后超时，最终失败导致部分mq消息丢失如何解决该问题场景

overfit同步小助手 2024-11-01 14:03:23 0 收藏

Kettle报错：使用mysql向hive中插入数据只能插入两条的错误

我们在用kettle，使用mysql向hive中插入数据的时候，创建好了一个转换，里面的操作也全部完成了之后，在执行时爆出一下错误例如我这里写入的表输入为：表输出为：看起来是一点问题也没有，但是一执行就会报上述错误，这时只需要在我们的/opt/installs/hive/conf下创建一个 .hiv

overfit同步小助手 2024-11-01 13:03:56 0 收藏

探索高效消息队列：RabbitMQ C++ 客户端库推荐

探索高效消息队列：RabbitMQ C++ 客户端库推荐【下载地址】RabbitMQC客户端库本仓库提供了一个基于 `rabbitmq-c` 库封装的 RabbitMQ C++ 客户端库，适用于 Linux 环境。该库旨在简化

overfit同步小助手 2024-11-01 13:03:52 0 收藏

Spark常用RDD算子：transformation转换算子以及action触发算子

transformation 转换算子对RDD数据进行转化得到新的RDD，定义了一个线程任务。常见：map、filter、flatMap、reduceByKey、groupByKey、sortByKeyaction 执行算子触发计算任务，让计算任务进行执行，得到结果。触发线程执行的。常见：forea

overfit同步小助手 2024-11-01 12:03:21 0 收藏

ubuntu20.04系统安装zookeeper简单教程

Apache Zookeeper是一个开源的分布式协调服务，广泛用于分布式应用程序中管理配置、提供命名服务、分布式同步以及组服务等。在本教程中，我们将详细介绍如何在Ubuntu系统中安装Zookeeper，并进行相关配置，使其能够正常运行。此外，Zookeeper依赖于Java环境，因此我们首先需要

overfit同步小助手 2024-11-01 11:03:15 0 收藏

Kafka 解决消息丢失、乱序与重复消费

Apache Kafka 作为一种强大的分布式消息系统，在实际应用中可能会遇到消息丢失、乱序、重复消费等问题。通过深入理解 Kafka 的工作原理，正确配置生产者、Broker 和消费者的参数，以及采取适当的解决方案，可以有效地解决这些问题，提高系统的稳定性和可靠性。在实际应用中，需要根据具体的业务

overfit同步小助手 2024-11-01 09:03:41 0 收藏

大数据-193 Apache Tez - DAG 作业计算框架核心解释工作原理配置集成

Tez 是一个运行在 Hadoop 生态系统中的高效数据处理框架，旨在优化批处理和交互式查询。它是 Apache 基金会下的一个开源项目，作为替代 MapReduce 的执行引擎使用。Tez 被设计为高度可扩展和灵活的平台，可以处理复杂的数据处理任务，而不仅限于传统的 MapReduce 计算模型。

overfit同步小助手 2024-11-01 09:03:22 0 收藏