一些中间件ES、RabbitMq
IKAnalyzer是一个开源的,基于Java语言开发的轻量级的中文分词工具包。从2006年12月推出1.0版开始,IKAnalyzer已经推出 了3个大版本。最初,它是以开源项目Lucene为应用主体的,结合词典分词和文法分析算法的中文分词组件。新版本的IKAnalyzer3.0则发展为面向J
【Spark】【翻译】RDD Programming Guide
Spark官方文档翻译系列,RDD编程指南(RDD Programming Guide)
hadoop2.x学习
大数据学习
zookeeper+kafka消息队列集群部署
zookeeper是一种分布式协调技术,所谓分布式协调技术主要是用来解决分布式环境当中多个进程之间的同步控制,让它们有序的去访问某个共享资源,防止造成资源竞争(脑裂)的后果。
集成Apache Kylin与Apache Hadoop:实现大数据高效分析
Apache Kylin是一个开源的分布式分析引擎,能够提供Hadoop之上的多维分析(OLAP)能力。Kylin通过预计算存储多维立方体(Cubes)来加速查询速度,能够在数秒内完成对TB级数据的查询。支持多维分析和OLAP查询。高效的查询速度,适用于大数据环境。与Hadoop生态系统的紧密集成,
rabbitmq 详细介绍、集群搭建、镜像队列,很全缺啥和我说
然而,这种机制并不能完全保证消息的高可用性。为此,我们要在 rabbit@hello-TQ2与rabbit@hello_TQ1 上停止 RabbitMQ 应用程序并加入 rabbit@VM-24-15-centos(node1节点) 群集,然后重新启动 node2、node3的RabbitMQ 应用
大数据开发面试题【Hadoop篇】
吐血整理 亲身体验的面试题总结
ZooKeeper以及DolphinScheduler的用法
希望对大家有帮助,谢谢大家的支持!
RabbitMQ Windows Server R2部署问题总结(三)
安装部署版本为:Microsoft Windows [版本 6.3.9600]保留所有权利。{error,{'SetConsoleMode','虏脦脢媒麓铆脦贸隆拢\r\n'}}}crasher:{error,{'SetConsoleMode','虏脦脢媒麓铆脦贸隆拢\r\n'}}links: []
HADOOP之YARN详解
第一代Hadoop,由分布式存储系统HDFS和分布式计算框架MapReduce组成。其中,HDFS由一个NameNode和多个DataNode组成,MapReduce由一个JobTracker和多个TaskTracker组成。对应Hadoop版本为Hadoop 1.x, 和0.21.x, 0.22.
RabbitMQ基础
RabbitMQ官网:https://rabbitmq.p2hp.com/
微服务-注册中心Eureka和Nacos
使用RestTemple很乱,麻烦。地址是写死了的,并且不确定这个地址实际上能否使用。
Flink LookupJoin攒批查询
使用Lookup Join进行维表关联时,流表数据需要实时与维表数据进行关联。使用Cache会导致数据关联不准确,不使用Cache会造成数据库服务压力。攒批查询是指攒够一定批数量的数据,相同的查询Key只查询一次,从而减少查询次数。对短时间Key重复率比较高的场景有不错的性能提升。
Flink-StarRocks详解:第四部分StarRocks分区管理,数据压缩(第54天)
本文为Flink-StarRocks详解后续章节:主要详解StarRocks分区分桶管理,数据压缩,由于篇幅过长,后续接着下面进行详解: StarRocks查询数据湖 实现即席查询案例。
大数据处理:大数据处理框架Hadoop、Spark
大数据处理是当代信息技术领域的一个重要分支,它涉及到海量数据的存储、管理和分析。为了高效地应对大数据处理的挑战,多种框架被开发出来,其中Hadoop和Spark是最为知名和广泛应用的两种。以下将详细介绍这两种框架以及它们在大数据处理中的应用和优势。
【毕业设计】基于Spark的在线音乐平台设计与实现
SpringBoot是一个开源的轻量级框架。它基于约定优于配置的原则,减少开发人员编写样板化配置的需求,从而提高开发效率和项目周期。SpringBoot不是用来替代Spring框架的解决方案,而是与之紧密结合,提升开发者体验的工具。SpringBoot的特点包括:创建独立的Spring应用程序:允许
(三)Java日志大数据(单机环境)学习笔记——Hadoop安装与配置
(三)Java日志大数据(单机环境)学习笔记——Hadoop安装与配置
RabbitMQ基础
publisher:消息发送者consumer:消息的发送者queue:队列,存储消息exchange:交换机通过到到到数据隔离,只能用户只能操作自己的虚拟主机。
一文读懂数据仓库ODS层
数据仓库一般分为三层,分别为数据贴源层(ODS,Operation Data Store)、数据公共层(CDM,Common Data Model)和数据应用层(ADS,Application Data Service)。其中CDM层又分为DWD明细层、DWS轻度汇总层和DIM维度层。本文从设计思路
RabbitMQ 安装
rabbitmq 管理界面无法显示,rabbitmq window 安装