大数据 - overfit.cn

【大数据】一篇认识Hive

文章目录一、数据仓库1.1、数据仓库概念1.2、数据仓库核心特征1.3、数据库和数据仓库的区别1.4、数据仓库分层架构[**重要**]1.5、ETL和ELT二、Apache Hive2.1、Hive的概念2.2、Hive的架构组件(非常重要)2.3、Hive和Mysql的区别三、Hive安装3.1、

overfit同步小助手 2024-10-25 02:03:53 0 收藏

毕设开源大数据招聘数据可视化系统（源码+论文）

🔥这两年开始毕业设计和毕业答辩的要求和难度不断提升，传统的毕设题目缺少创新和亮点，往往达不到毕业答辩的要求，这两年不断有学弟学妹告诉学长自己做的项目系统达不到老师的要求。为了大家能够顺利以及最少的精力通过毕设，学长分享优质毕业设计项目，今天要分享的是🚩毕业设计大数据招聘数据可视化系统（源码+论

overfit同步小助手 2024-10-25 02:03:34 0 收藏

Kafka、Zookeeper、Redis、MySQL和Elasticsearch（ES）鉴权配置

确保这些服务的鉴权机制启用是非常重要的，可以通过检查配置文件、查看日志和使用命令行工具来确认。如果发现没有启用鉴权机制，建议尽快配置以确保服务的安全性。配置文件的具体路径可能会因容器镜像的不同而有所变化，建议参考具体镜像的文档或Dockerfile。

overfit同步小助手 2024-10-25 01:03:47 0 收藏

Hadoop MapReduce计算框架原理与代码实例讲解

Hadoop MapReduce计算框架原理与代码实例讲解作者：禅与计算机程序设计艺术 / Zen and the Art of Computer Programming1. 背景介绍1.1 问题的由来

overfit同步小助手 2024-10-25 01:03:40 0 收藏

Linux中Hadoop常用命令

overfit同步小助手 2024-10-25 00:03:43 0 收藏

基于Hive的网络电视剧收视率分析系统大数据Hadoop

本系统基于 Java 与 Spring Boot 技术，并结合 Hive 来实现对网络电视剧收视率的深入分析。它能够广泛收集来自多个渠道的相关数据，包括各网络平台上电视剧的播放量、观看时长、观众地域分布、年龄层次、观看设备类型以及观众的互动数据（如评论、点赞、分享等）。这些数据被整合存储到 Hive

overfit同步小助手 2024-10-24 23:03:23 0 收藏

【2024】kafka streams结合案例分析进行实际项目开发使用（3）

前面已经大致介绍了kafka streams的基本使用了，这里结合一个实际案例来进行练习使用kafka streams。下面案例是一个商场购物的场景，就比如我们去一个购物商场购买东西时，在购买的时候。商场会记录下来我们这一次消费的信息，一般首先会先把银行卡等信息进行一个加***隐藏，然后再把信息分别

overfit同步小助手 2024-10-24 22:03:59 0 收藏

【RabbitMQ】应用

P: ⽣产者, 也就是要发送消息的程序C: 消费者,消息的接收者Queue: 消息队列, 图中⻩⾊背景部分. 类似⼀个邮箱, 可以缓存消息;

overfit同步小助手 2024-10-24 21:03:54 0 收藏

kafka基本概念以及用法

kafka是一个分布式流处理工具，被全球大量公司广泛应用在大数据处理领域。

overfit同步小助手 2024-10-24 21:03:34 0 收藏

FlinkTableAPI:有限自动机与正则表达式

FlinkTableAPI:有限自动机与正则表达式作者：禅与计算机程序设计艺术 / Zen and the Art of Computer Programming1. 背景介绍1.1 问题的由来在流处理领域

overfit同步小助手 2024-10-24 20:04:13 0 收藏

全网最易详解-数据仓库分区详解

最近要搭某个业务域的数仓，本来设计规划的挺好的，该搭DIM,DWD,DWS的也都设计好了，结果一跑数仓，全是大大小小的BUG，最后揪出来整个过程，最大的烦人东西就是设计ETL数据入库分区的问题。那么这时候肯定有人说：咳，小事，不整那么多分区表，整全量表就不行了吗？但事实就是如果业务实际到前后两天必须

overfit同步小助手 2024-10-24 20:04:05 0 收藏

RabbitMQ 高级特性——死信队列

RabbitMQ死信队列

overfit同步小助手 2024-10-24 19:03:50 0 收藏

Kafka、RocketMQ 、RabbitMQ 是什么？

说白了，它其实是个链表，链表的每个节点就是一个消息。每个节点有一个序号，我们叫它Offset，记录消息的位置。服务依据自己的处理能力，消费链表里的消息。能处理多少是多少，不断更新已处理 Offset 的值。但这有个问题，来不及处理的消息会堆积在内存里，如果服务更新重启，这些消息就都丢了。这个好解决，

overfit同步小助手 2024-10-24 19:03:46 0 收藏

【Meetup预约】从哔哩哔哩到阿里云：大数据调度与云上数仓的最佳实践

是一个云原生并带有强大可视化界面的大数据工作流调度平台，致力于让调度变得更加容易，已在 3000+家公司的生产环境上稳定运行。身为一款专门针对于大数据平台和大模型的工作调度系统，支持可视化的数据准备和大模型FineTune等功能。同时Apache DolphineScheduler还拥有十分活跃的社

overfit同步小助手 2024-10-24 19:03:42 0 收藏

拉取/启动kafka的docker镜像

overfit同步小助手 2024-10-24 18:03:41 0 收藏

卸载RabbitMq

卸载RabbitMQ的方法取决于您最初安装它时所使用的工具和平台。

overfit同步小助手 2024-10-24 17:03:49 0 收藏

全国30省份各省资本存量数据固定资本形成总额永续盘存法（2000-2023年）

各省资本存量数据通过永续盘存法进行了详细的计算，这一方法覆盖了中国30个省份（不包括西藏），提供从2000年起直至2023的资本存量数据集。以2000年作为基期年份，依据单豪杰（2008）在《中国资本存量K的再估算：1952～2006年》一文中的方法，首先确定了各省份的初始资本存量。随后，应用永续盘

overfit同步小助手 2024-10-24 17:03:43 0 收藏

大厂面试真题-说一说Kafka的消息积压

Kafka消息积压是指Kafka中消息未能被消费者及时消费而在队列中累积的现象。

overfit同步小助手 2024-10-24 17:03:36 0 收藏

rabbitmq容器化部署

找到如下官网信息版本这里看到最新版本是3.13版本，这里在3.13中找一个版本下载容器镜像即可。找到dockrhub.com中找到3.13.2版本镜像。容器服务安装此处省略现在下载容器镜像需要配置容器代理下载rabbitmq镜像部署容器服务查看容器状态，容器异常退出，查看容器日志这个报错是容器出现

overfit同步小助手 2024-10-24 16:05:04 0 收藏

2024全国大数据与计算智能挑战赛火热报名中！

一年一度，快来报名！

overfit同步小助手 2024-10-24 16:04:39 0 收藏