大数据 - overfit.cn

2024数据仓库建设规范指南

数据仓库建设规范指南

overfit同步小助手 2024-11-29 11:03:27 0 收藏

Hbase Shell

首先登陆SSH，由于之前在中已经设置了无密码登录，因此这里不需要密码。然后，切换至输入命令，如果能够看到NameNodeDataNode和这三个进程，则表示已经成功启动Hadoop。输入命令现在就可以进入进入HBase shell命令行模式以后，用户可以通过输入shell命令操作HBase数据库。

overfit同步小助手 2024-11-29 10:03:56 0 收藏

RabbitMQ应用

涉及rabbitmq-communication与springboot-rabbitmq代码

overfit同步小助手 2024-11-29 10:03:48 0 收藏

基于Python大数据的B站热门视频的数据分析及可视化系统

【2025最新】基于Python大数据+Flask+Vue+MySQL的B站热门视频的数据分析及可视化系。

overfit同步小助手 2024-11-29 10:03:43 0 收藏

Flink系列知识之：Checkpoint原理

overfit同步小助手 2024-11-29 07:03:37 0 收藏

Flink Checkpoint expired before completing解决方法

3.这种方法如果不行，说明是CK过于复杂，需要较多的资源和时间，这个时候，可以考虑修改CK逻辑，使其尽量简便，也可以使用RockDB加快CK的速度。现在回到我们的报错，这个明显是算子的Checkpoint时间超时了，点开CheckPoint节点一看，Checkpoint一直报错。2.延长Checkp

overfit同步小助手 2024-11-29 07:03:34 0 收藏

大数据新视界 -- Hive 数据分区：提升查询效率的关键步骤（下）（8/ 30）

本文承前启后，深挖 Hive 数据分区提效步骤（修剪、合并、与缓存协同），附实例、代码、测试，析原理且解实操困境，具强参考价值，设互动并预告数据桶篇章。

overfit同步小助手 2024-11-29 06:03:21 0 收藏

在完全分布式hadoop上部署hbase

7. 将集群主节点master的/etc/profile文件和hbase安装目录分发到slave1和slave2子节点，并刷新slave1、slave2的环境变量。5. 编辑/usr/local/src/hbase/conf/hbase-site.xml配置文件。6. 编辑/usr/local/sr

overfit同步小助手 2024-11-29 05:03:44 0 收藏

Windows 版本 RabbitMQ 安装包

Windows 版本 RabbitMQ 安装包【下载地址】Windows版本RabbitMQ安装包本仓库提供了一个适用于 Windows 系统的 RabbitMQ 安装包，包含以下内容：- **rabbitmq-server-3

overfit同步小助手 2024-11-29 05:03:38 0 收藏

hive数据库||的用法、hive数据库字符串拼接、concat函数、concat_ws函数

overfit同步小助手 2024-11-29 05:03:34 0 收藏

Hive数据仓库工具64位预编译版0.13.1安装指南

本文还有配套的精品资源，点击获取简介：Hive 0.13.1是一个数据仓库工具，允许用户通过类似SQL的Hive Query Language（HQL）来管理、查询和处理大数据集。本64位二进制版本特别为优化大规模数据处理而设计，利用64位处理器的优势，支持更多并发和更大内存地址空间。本版本改

overfit同步小助手 2024-11-29 04:03:42 0 收藏

Ambari里面添加hive组件

在添加hive组件之前需要做的事情，先在master这个虚拟机里面创建好hive先进入虚拟机里面进入mysql然后输入这个命令看看有没有自己创建的hive数据库有的话会显示下面这个样子没有的同学使用以下命令可以在MySQL中创建hive数据库（本人给的hive数据库密码是hive）

overfit同步小助手 2024-11-29 03:03:58 0 收藏

Flink使用SQL Gateway提交SQL Job到远程集群

flink使用sql gateway提交Job到远程集群，从Flink 1.16.0开始集成了SQL Gateway功能，提供了多种客户端远程并发执行SQL的能力。不用再使用提交jar包的方式来创建任务了。我是使用filnk 1.17.1版本。SQL Gateway提交作业的执行后端可以是Flink

overfit同步小助手 2024-11-29 03:03:39 0 收藏

毕设大数据用户画像分析系统(源码分享)

Hi，大家好，这里是丹成学长，今天做一个电商销售预测分析，这只是一个demo，尝试对电影数据进行分析，并可视化系统🔥 这两年开始毕业设计和毕业答辩的要求和难度不断提升，传统的毕设题目缺少创新和亮点，往往达不到毕业答辩的要求，这两年不断有学弟学妹告诉学长自己做的项目系统达不到老师的要求。为了大家能够

overfit同步小助手 2024-11-29 03:03:28 0 收藏

数据仓库系列7：什么是概念模型、逻辑模型和物理模型,它们有什么区别?

概念模型是数据建模过程中最高层次的抽象。它就像是你数据世界的"鸟瞰图"。这个模型主要关注的是业务概念以及它们之间的关系,而不涉及任何技术细节。逻辑模型是概念模型的下一步细化。它保持了技术中立性,但比概念模型更加详细。逻辑模型定义了数据结构,包括实体、属性、关系和主键。物理模型是数据模型的最后一个阶段

overfit同步小助手 2024-11-29 02:03:30 0 收藏

高级java每日一道面试题-2024年10月28日-RabbitMQ篇-RabbitMQ的使用场景有哪些?

RabbitMQ 的使用场景非常广泛，涵盖了异步处理、削峰填谷、日志收集、任务分发、系统解耦、事件通知、幂等性处理、流量控制、事务处理和消息路由等多个方面。在面试中，能够详细解释这些场景及其实现方式，可以展示你对 RabbitMQ 的深入理解和实际应用能力。

overfit同步小助手 2024-11-29 00:03:45 0 收藏

Hive 整合 Spark 全教程（Hive on Spark）

分类应用Haddop 2.xHaddop 3.xNNPortsNamenode80209820NNPortsNN HTTP UI500709870NNPorts504709871SNN portsSNN HTTP500919869SNN ports500909868DN portsDN IPC500

overfit同步小助手 2024-11-29 00:03:42 0 收藏

【Hadoop生态圈】Hadoop 概述

Hadoop Distributed File System，简称 HDFS，是一个分布式文件系统。1）NameNode（nn）：存储文件的元数据，如文件名，文件目录结构，文件属性（生成时间、副本数、文件权限），以及每个文件的块列表和块所在的DataNode等。2）DataNode(dn)：在本地文

overfit同步小助手 2024-11-29 00:03:33 0 收藏

Kafka为啥比RocketMQ快

- • RocketMQ 和 kafka 相比，在架构上做了减法，在功能上做了加法- • 跟 kafka 的架构相比，RocketMQ 简化了协调节点和分区以及备份模型。同时增强了消息过滤、消息回溯和事务能力，加入了延迟队列，死信队列等新特性。- • 凡事皆有代价，RocketMQ 牺牲了一部分性能

overfit同步小助手 2024-11-28 23:03:49 0 收藏

Hadoop面试题01

磁盘IO（正解），CPU，内存，网络带宽。

overfit同步小助手 2024-11-28 22:03:50 0 收藏