大数据 - overfit.cn

zookeeper介绍与配置

ZooKeeper是一个分布式的，开放源码的分布式应用程序协调服务，是Google的Chubby一个开源的实现，是Hadoop和Hbase的重要组件。它是一个为分布式应用提供一致性服务的软件，提供的功能包括：配置维护、域名服务、分布式同步、组服务等。ZooKeeper的目标就是封装好复杂易出错的关键

overfit同步小助手 2023-11-13 00:03:11 0 收藏

新创建多模块工程执行maven编译打包出现non-resolvable parent pom异常

overfit同步小助手 2023-11-12 23:03:47 0 收藏

云计算与大数据实验七 HBase的安装与基本操作

非常消耗资源，所以你在长时间没使用命令行后台会回收资源，如果你想保持环境不被注销，请在弹出延时窗口时点击延时，并且保持操作命令行，这样可以保持你的环境一直持续。要新建一个表，首先必须要给它起个名字，并为其定义模式，一个表的模式包含表的属性和列族的列表。的安装也分为三种，单机版、伪分布式、分布式；当然

overfit同步小助手 2023-11-12 23:03:42 0 收藏

【基础篇】三、Flink集群角色、系统架构以及作业提交流程

TaskManager是Flink中的工作进程，数据流的具体计算就是它来做的。需要注意在早期版本的Flink中，没有JobMaster的概念，而JobManager的概念范围较小，实际指的就是现在所说的JobMaster。这里的ResourceManager是Flink内置的资源管理组件，和其他资源

overfit同步小助手 2023-11-12 23:03:31 0 收藏

头歌大数据——MapReduce综合应用案例 — 电信数据清洗答案无解析

Tips：本关需要补充三个文件的代码～如下图所示，点击小三角切换文件～根据提示，在右侧编辑器补充代码，对数据按照一定规则进行清洗。记得启动HDFS～～

overfit同步小助手 2023-11-12 22:03:49 0 收藏

Flink SQL Hive Connector使用场景

本文基于FLink1.16讨论，Apache Flink Hive Connector提供了Flink与Hive的集成，主要用于在Flink中读取和写入Hive数据

overfit同步小助手 2023-11-12 22:03:42 0 收藏

Flink学习之旅：（三）Flink源算子（数据源）

大多数情况下，前面几个数据源已经满足需求了。但是遇到特殊情况我们需要自定义的数据源。实现方式如下：1.编辑自定义源Source/***//**** 主要实现2个方法 run() 和 cancel()*/// 声明一个布尔变量，作为控制数据生成的标识位@Override// 在指定的数据集中随机选取数

overfit同步小助手 2023-11-12 21:03:19 0 收藏

Hadoop集群！将HDFS副本数设置为3；可以正常提交MapReduce运行！

HDFS 数据副本概念：HDFS数据副本存放策略，副本的存放是HDFS可靠性和高性能的关键。优化的副本存放策略是HDFS区分于其他大部分分布式文件系统的重要特性。这种特性需要做大量的调优，并需要经验的积累。

overfit同步小助手 2023-11-12 19:03:51 0 收藏

CollovGPT——人工智能工具颠覆传统室内设计行业

基于Stable Diffusion（扩散模型）和GNN（图神经网络）技术开发的一键AI室内设计平台

overfit同步小助手 2023-11-12 19:03:36 0 收藏

关于ES集群规模规划

在搭建正式的生产集群之前，充分做好硬件和服务器配置以及集群规划是重中之重，磨刀不误砍柴工。

overfit同步小助手 2023-11-12 16:03:47 0 收藏

RabbitMq消息中间件如何理解削峰，根据业务场景进行阐述？

这样可以实现异步处理，提高系统的响应速度。消费者可以设置每次处理的消息数量和处理速度，从而避免在高峰期因过多的并发请求而导致系统崩溃。当系统的处理能力无法满足高峰期的请求时，消息队列可以暂时存储这些消息，等待消费者有空闲资源时再进行处理。在高并发的业务场景中，RabbitMQ 可以帮助实现削峰，即在

overfit同步小助手 2023-11-12 15:03:46 0 收藏

【大数据】Kafka 入门简介

Partition 中的消息序列是有序的消息序列。Kafka 在 Partition 使用偏移量（Offset）来指定消息的位置。一个 Topic 的一个 Partition 只能被一个 Consumer Group 中的一个 Consumer 消费，同组的多个 Consumer 消费同一个 Par

overfit同步小助手 2023-11-12 14:03:31 0 收藏

Flink实现kafka到kafka、kafka到doris的精准一次消费

【代码】Flink实现kafka到kafka、kafka到doris的精准一次消费。

overfit同步小助手 2023-11-12 12:03:40 0 收藏

Flink之常用处理函数

处理函数Processing Function是Apache Flink中用于对数据流上的元素进行处理的核心组件之一。处理函数负责定义数据流上的数据如何被处理，允许开发人员编写自定义逻辑以执行各种操作，如转换、聚合、筛选、连接等，并在处理后生成输出数据流。

overfit同步小助手 2023-11-12 11:03:39 0 收藏

大数据毕设项目大数据电影数据分析与可视化系统 - python Django

🔥 这两年开始毕业设计和毕业答辩的要求和难度不断提升，传统的毕设题目缺少创新和亮点，往往达不到毕业答辩的要求，这两年不断有学弟学妹告诉学长自己做的项目系统达不到老师的要求。为了大家能够顺利以及最少的精力通过毕设，学长分享优质毕业设计项目，今天要分享的是🚩 **基于大数据的电影数据分析与可视化系

overfit同步小助手 2023-11-12 10:03:55 0 收藏

Spring Cloud应用- Eureka原理、搭建

Spring cloud eureka原理以及系统搭建

overfit同步小助手 2023-11-12 10:03:50 0 收藏

【Python大数据笔记_day05_Hive基础操作】

Hive基础操作

overfit同步小助手 2023-11-12 10:03:40 0 收藏

springboot+RabbitMQ实现一条消息被所有consumer消费

这样，启动3个ac副本，就有3个queue绑定到了ac的exchange，mq message发送到topic exchange，通过routing key分发到所有符合规则的queue，就能实现所有副本消费同一条消息。所以，用户登录请求通过负载均衡落到ac副本1（简称ac1）后，ac1生成jwt

overfit同步小助手 2023-11-12 08:03:27 0 收藏

企业级大数据体系结构

作者：禅与计算机程序设计艺术 1.简介企业级大数据是指超大规模数据的集合，是管理者、分析师、决策者所需要分析和处理的一种信息资源。基于海量数据的复杂性及其多样性，实现数据可视化、数据挖掘、机器学习等数据处理功能的大数据平台也逐渐成为行业关注热点。因此，越来越多的

overfit同步小助手 2023-11-12 04:03:44 0 收藏

springboot+vue基于Hadoop短视频流量数据分析与可视化系统的设计与实现【内含源码+文档+部署教程】

该系统基于Hadoop平台，利用Java语言、MySQL数据库，结合目前流行的 B/S架构，将短视频流量数据分析与可视化管理的各个方面都集中到数据库中，以便于用户的需要。管理员进行爬取数据后，点击主页面右上角的看板，可以查看到系统简介、番剧信息总数、评分统计、选集统计、epid统计、播放量统计、弹幕

overfit同步小助手 2023-11-12 02:03:44 0 收藏