大数据 - overfit.cn

一些中间件ES、RabbitMq

IKAnalyzer是一个开源的，基于Java语言开发的轻量级的中文分词工具包。从2006年12月推出1.0版开始，IKAnalyzer已经推出了3个大版本。最初，它是以开源项目Lucene为应用主体的，结合词典分词和文法分析算法的中文分词组件。新版本的IKAnalyzer3.0则发展为面向J

overfit同步小助手 2024-08-04 20:03:20 0 收藏

【Spark】【翻译】RDD Programming Guide

Spark官方文档翻译系列，RDD编程指南（RDD Programming Guide）

overfit同步小助手 2024-08-04 18:03:44 0 收藏

hadoop2.x学习

大数据学习

overfit同步小助手 2024-08-04 17:03:21 0 收藏

zookeeper+kafka消息队列集群部署

zookeeper是一种分布式协调技术，所谓分布式协调技术主要是用来解决分布式环境当中多个进程之间的同步控制，让它们有序的去访问某个共享资源，防止造成资源竞争（脑裂）的后果。

overfit同步小助手 2024-08-04 16:03:48 0 收藏

集成Apache Kylin与Apache Hadoop：实现大数据高效分析

Apache Kylin是一个开源的分布式分析引擎，能够提供Hadoop之上的多维分析（OLAP）能力。Kylin通过预计算存储多维立方体（Cubes）来加速查询速度，能够在数秒内完成对TB级数据的查询。支持多维分析和OLAP查询。高效的查询速度，适用于大数据环境。与Hadoop生态系统的紧密集成，

overfit同步小助手 2024-08-04 16:03:16 0 收藏

rabbitmq 详细介绍、集群搭建、镜像队列，很全缺啥和我说

然而，这种机制并不能完全保证消息的高可用性。为此，我们要在 rabbit@hello-TQ2与rabbit@hello_TQ1 上停止 RabbitMQ 应用程序并加入 rabbit@VM-24-15-centos（node1节点）群集，然后重新启动 node2、node3的RabbitMQ 应用

overfit同步小助手 2024-08-04 15:03:53 0 收藏

大数据开发面试题【Hadoop篇】

吐血整理亲身体验的面试题总结

overfit同步小助手 2024-08-04 14:03:51 0 收藏

ZooKeeper以及DolphinScheduler的用法

希望对大家有帮助，谢谢大家的支持！

overfit同步小助手 2024-08-04 13:03:42 0 收藏

RabbitMQ Windows Server R2部署问题总结（三）

overfit同步小助手 2024-08-04 12:03:53 0 收藏

HADOOP之YARN详解

第一代Hadoop，由分布式存储系统HDFS和分布式计算框架MapReduce组成。其中，HDFS由一个NameNode和多个DataNode组成，MapReduce由一个JobTracker和多个TaskTracker组成。对应Hadoop版本为Hadoop 1.x, 和0.21.x, 0.22.

overfit同步小助手 2024-08-04 12:03:42 0 收藏

RabbitMQ基础

RabbitMQ官网：https://rabbitmq.p2hp.com/

overfit同步小助手 2024-08-04 11:03:44 0 收藏

微服务-注册中心Eureka和Nacos

使用RestTemple很乱，麻烦。地址是写死了的，并且不确定这个地址实际上能否使用。

overfit同步小助手 2024-08-04 11:03:40 0 收藏

Flink LookupJoin攒批查询

使用Lookup Join进行维表关联时，流表数据需要实时与维表数据进行关联。使用Cache会导致数据关联不准确，不使用Cache会造成数据库服务压力。攒批查询是指攒够一定批数量的数据，相同的查询Key只查询一次，从而减少查询次数。对短时间Key重复率比较高的场景有不错的性能提升。

overfit同步小助手 2024-08-04 09:03:17 0 收藏

Flink-StarRocks详解:第四部分StarRocks分区管理，数据压缩(第54天)

本文为Flink-StarRocks详解后续章节：主要详解StarRocks分区分桶管理，数据压缩，由于篇幅过长，后续接着下面进行详解： StarRocks查询数据湖 实现即席查询案例。

overfit同步小助手 2024-08-04 08:03:22 0 收藏

大数据处理：大数据处理框架Hadoop、Spark

大数据处理是当代信息技术领域的一个重要分支，它涉及到海量数据的存储、管理和分析。为了高效地应对大数据处理的挑战，多种框架被开发出来，其中Hadoop和Spark是最为知名和广泛应用的两种。以下将详细介绍这两种框架以及它们在大数据处理中的应用和优势。

overfit同步小助手 2024-08-04 05:03:50 0 收藏

【毕业设计】基于Spark的在线音乐平台设计与实现

SpringBoot是一个开源的轻量级框架。它基于约定优于配置的原则，减少开发人员编写样板化配置的需求，从而提高开发效率和项目周期。SpringBoot不是用来替代Spring框架的解决方案，而是与之紧密结合，提升开发者体验的工具。SpringBoot的特点包括：创建独立的Spring应用程序：允许

overfit同步小助手 2024-08-04 05:03:41 0 收藏

（三）Java日志大数据（单机环境）学习笔记——Hadoop安装与配置

overfit同步小助手 2024-08-04 04:03:30 0 收藏

RabbitMQ基础

publisher:消息发送者consumer:消息的发送者queue:队列，存储消息exchange:交换机通过到到到数据隔离，只能用户只能操作自己的虚拟主机。

overfit同步小助手 2024-08-04 03:03:45 0 收藏

一文读懂数据仓库ODS层

数据仓库一般分为三层，分别为数据贴源层（ODS，Operation Data Store）、数据公共层（CDM，Common Data Model）和数据应用层（ADS，Application Data Service）。其中CDM层又分为DWD明细层、DWS轻度汇总层和DIM维度层。本文从设计思路

overfit同步小助手 2024-08-04 01:03:46 0 收藏

RabbitMQ 安装

rabbitmq 管理界面无法显示，rabbitmq window 安装

overfit同步小助手 2024-08-03 22:04:00 0 收藏

一些中间件ES、RabbitMq

【Spark】【翻译】RDD Programming Guide

hadoop2.x学习

zookeeper+kafka消息队列集群部署

集成Apache Kylin与Apache Hadoop：实现大数据高效分析

rabbitmq 详细介绍、集群搭建、镜像队列，很全缺啥和我说

大数据开发面试题【Hadoop篇】

ZooKeeper以及DolphinScheduler的用法

RabbitMQ Windows Server R2部署问题总结（三）

HADOOP之YARN详解

RabbitMQ基础

微服务-注册中心Eureka和Nacos

Flink LookupJoin攒批查询

Flink-StarRocks详解:第四部分StarRocks分区管理，数据压缩(第54天)

大数据处理：大数据处理框架Hadoop、Spark

【毕业设计】基于Spark的在线音乐平台设计与实现

（三）Java日志大数据（单机环境）学习笔记——Hadoop安装与配置

RabbitMQ基础

一文读懂数据仓库ODS层

RabbitMQ 安装

作者榜

资讯小助手

内容小助手

Deephub

奕凯