大数据 - overfit.cn

2.Zookeeper集成springboot操作节点，事件监听，分布式锁实现

1.Springboot项目中添加zookeeper 已经对应的客户端依赖，pom.xml文件如下。2.application.yml 文件中配置zookeeper连接的相关配置信息。3.java配置的方式添加zookeeper相关的配置。4.Zookeeper基础操作服务和分布式锁服务编码。5.

overfit同步小助手 2024-03-18 01:04:10 0 收藏

HADOOP完全分布式搭建（饭制版）

HADOOP完全分布式搭建

overfit同步小助手 2024-03-18 01:03:50 0 收藏

Zookeeper与ApacheSpark的实现与应用

Zookeeper与ApacheSpark的实现与应用作者：禅与计算机程序设计艺术背景介绍分布式系统的发展近年来，随着互联网和物联网的快速发展，分布式系统的应用也变得越来越普遍。分布式系统是指由多个节点组

overfit同步小助手 2024-03-18 01:03:33 0 收藏

深入理解Hive：探索不同的表类型及其应用场景

在本文中，我们深入探讨了Hive数据仓库中的表类型，包括内部表、外部表、分区表、桶表、视图以及临时表。每种表类型都有其独特的特性和适用场景，它们共同构成了Hive强大的数据管理能力。内部表和外部表主要根据数据存储位置和生命周期管理来区分。内部表的数据与Hive的元数据紧密关联，而外部表则允许数据在H

overfit同步小助手 2024-03-18 00:03:20 0 收藏

数据仓库原理（二）

本文介绍数据仓库的概念模型、逻辑模型和物理模型。

overfit同步小助手 2024-03-17 23:03:44 0 收藏

【项目实战】基于Spark大数据的餐饮外卖数据分析可视化系统hadoop项目hive计算机程序设计

overfit同步小助手 2024-03-17 22:03:51 0 收藏

zookeeper到nacos的迁移实践

nacos作为一个比较新的开源组件，使用时必然会遇到各种各样的问题，本文重点介绍了笔者在迁移zookeeper到nacos中遇到的比较重要的坑点，希望对大家有所帮助，当然还有更多的细节限于篇幅未能罗列。

overfit同步小助手 2024-03-17 22:03:15 0 收藏

大数据入门之hadoop学习

大数据通常指的是数据集规模非常庞大且难以在常规数据库和数据处理工具中有效处理的数据。

overfit同步小助手 2024-03-17 21:03:43 0 收藏

HIVE伪分布安装

五、安装元数据库 Hive 高版本启动时，需要配置元数据库，如果采用其它数据库，请酌情替换对应步骤，这里采用 MYSQL 作为元数据库。Hive是基于Hadoop的一个数据仓库工具，可以将结构化的数据文件映射为一张表，类似于RDBMS(关系型数据库，如MySQL、Oracle、PgSQL)，并提供类

overfit同步小助手 2024-03-17 20:03:49 0 收藏

Android MQTT开发之 Hivemq MQTT Client

刚开始在自动连接这块花了好多时间，最后才发现是设置用户名和密码的地方不对，一定要在设置自动重连（初始化Client）的地方设置，而不是连接的时候！下面是一个简单的使用示例代码。

overfit同步小助手 2024-03-17 20:03:34 0 收藏

【kafka日常操作命令及分区分配】

使用zookeeper命令修改分区数发现报错，是因为kafka版本过高，该命令已经无法使用，修改为kafka-topics.sh --bootstrap-server kafka.safedog.cn:9092 --alter --topic serverBaseInfo.mysql --part

overfit同步小助手 2024-03-17 20:03:25 0 收藏

震惊！！！跟着我学Hadoop，既然如此简单。(快收藏起来学习吧)

MapReduce是一个分布式运算程序的编程框架，是用户开发"Hadoop的数据分析应用"的核心框架。MapReduce的思想核心是"分而治之"，适用于大量复杂的任务处理场景（大规模数据处理场景）。Map负责"分"，即把复杂的任务分解为若干个"简单的任务"来并行处理。可以进行拆分的前提是这些小任务可

overfit同步小助手 2024-03-17 20:03:16 0 收藏

技术精英求职必备：大数据研发工程师简历模板

在当今数据驱动的时代，成为一名优秀的大数据研发工程师意味着站在技术发展的前沿。本文提供了专为大数据研发工程师设计的未来简历模板和撰写指南。文章详细介绍了如何在简历中高效展示技术能力、项目经验和数据分析技巧，以适应不断变化的行业需求。我们强调了将复杂数据技能以清晰、有条理的方式呈现的重要性，并提供了创

overfit同步小助手 2024-03-17 19:03:49 0 收藏

win10环境安装docker及使用docker搭建hadoop、hive环境

overfit同步小助手 2024-03-17 19:03:44 0 收藏

Kafka是如何防止消息丢失的

需要注意的是，虽然Kafka通过上述机制可以尽可能地防止消息丢失，但在某些极端情况下（如硬件故障、网络中断等），仍然可能会出现消息丢失的情况。副本机制：Kafka引入了多副本机制，每个分区的数据都有多个副本，当主副本（leader）出现故障时，可以从其他副本（follower）中选举出新的leade

overfit同步小助手 2024-03-17 19:03:37 0 收藏

大数据毕设分享大数据电商用户行为分析 -python 大数据

🔥 这两年开始毕业设计和毕业答辩的要求和难度不断提升，传统的毕设题目缺少创新和亮点，往往达不到毕业答辩的要求，这两年不断有学弟学妹告诉学长自己做的项目系统达不到老师的要求。为了大家能够顺利以及最少的精力通过毕设，学长分享优质毕业设计项目，今天要分享的是🚩基于大数据的淘宝用户行为分析🥇学长这里给

overfit同步小助手 2024-03-17 18:03:19 0 收藏

kafka可视化工具-kafkamap

kafka可视化界面

overfit同步小助手 2024-03-17 17:03:21 0 收藏

基于Python的电子产品销售数据可视化分析 (大数据专业毕设)

本研究的目的是利用Python编程语言对电子产品销售数据进行可视化分析。通过对电子产品销售数据的可视化分析，可以更好地理解电子产品市场的发展趋势、消费者行为以及销售策略的有效性，并为相关业务决策提供科学依据。

overfit同步小助手 2024-03-17 15:03:47 0 收藏

Hadoop、MapReduce、Spark

优缺点优点：1.易于编程 — 底层实现了接口2.良好的扩展性 — 可增加节点3.高容错性 — 保证任务的完成4.适合PB级别以上的海量数据的离线处理 — 可实现服务器内节点并发工作缺点：1.不擅长实时计算 — 无法做到毫秒或者秒级内返回结果2.不擅长流式计算 — MR 的输入数据集是静态的，流式计算

overfit同步小助手 2024-03-17 14:03:54 0 收藏

java中使用rabbitmq

mq常用于业务解耦、流量削峰和异步通信,rabbitmq是使用范围较广,比较稳定的一款开源产品,接下来我们使用springboot的starter来引入rabbitmq,了解mq的几种使用模式,通过几个简单的案例，让你可以快速地了解到该使用哪种模式来对应业务场景，使用rabbitmq看这一篇就够了，

overfit同步小助手 2024-03-17 14:03:39 0 收藏