SeaTunnel 学习笔记
SeaTunnel 学习笔记
Hadoop环境搭建(全网最详细,保姆级教程)
搭建hadoop单机伪分布式环境
MPP数据库简介及架构分析
MPP (Massively Parallel Processing),即大规模并行处理。简单来说,MPP是将任务并行的分散到多个服务器和节点上,在每个节点上计算完成后,将各自部分的结果汇总在一起得到最终的结果(与Hadoop相似)。MPP数据库是一款 Shared Nothing架构的分布式并行结
【2023】DevOps、SRE、运维开发面试宝典之RabbitMQ相关面试题
MQ的全称是Message Queue(消息队列),是在消息的传输过程中保存消息的容器,用于分布式系统之间进行通信,通信双方将请求写入到MQ消息队列中,被调用者从MQ中读取请求数据。在传统情况下,系统之间的调用都是通过接口进行远程调用的,如下图所示,A系统通过远程接口调用B系统,两个系统之间会存在耦
【SQL开发实战技巧】系列(二十):数据仓库中时间类型操作(进阶)获取季度开始结束时间以及如何统计非连续性时间的数据
本篇文章讲解的主要内容是:***汇总报表时常要求按季度分类汇总这就需要通过给定年份获取对应的季度开始结束时间、业务数据不连续的情况下如何统计所有年份数据、如何统计相同月份与周内日期聘用的员工、如何返回2月或12月聘用的所有员工以及周二聘用的所有员工***
【2023】DevOps、SRE、运维开发面试宝典之Kafka相关面试题
消息生产者Producer产生消息数据,发送到Kafka消息队列中,一台Kafka节点只有一个Broker,消息会存储在Kafka的Topic(主题中),不同类型的消息数据会存储在不同的Topic中,可以利用Topic实现消息的分类,消息消费者Consumer会订阅消息存储的Topic,从Topic
基于Hadoop的电商广告点击数的分析与可视化(Shell脚本执行与大屏可视化设计)
本项目需要部署的可以私信博主!!!!!!!!!本文介绍了基于Hadoop的电商广告点击数的分析与可视化,以及相应的Shell脚本执行和大屏可视化设计。首先,我们介绍了Hadoop的基本原理和使用方法,包括如何安装和配置Hadoop集群。然后,我们介绍了如何使用Hadoop MapReduce框架对电
什么是shuffle?shuffle的原理及过程
首先,我们给 Shuffle 下了一个明确的定义,在分布式计算场景中,Shuffle 指的是集群范围内跨节点、跨进程的数据分发。我们在最开始提到,Shuffle 的计算会消耗所有类型的硬件资源。具体来说,Shuffle 中的哈希与排序操作会大量消耗 CPU,而 Shuffle Write 生成中间文
RabbitMQ 集群部署及配置
RabbitMQ 集群部署及配置,搭建 rabbitmq 的一般模式集群,搭建 rabbitmq 的镜像高可用模式集群
Java Elasticsearch教程
Elasticsearch 是一个分布式、RESTful 风格的搜索和数据分析引擎,本教程从Java语言角度讲解如何操作Elasticsearch,如果不熟悉Elasticsearch,可以先学习Elasticsearch教程,掌握基本概念和查询语法
《校园二手商品交易平台设计与实现》 开题报告
《校园二手商品交易平台设计与实现》 开题报告
ES添加用户名和密码
数据安全很重要,ES数据上线必须加密码,告诉你怎么加用户和密码
ES数据库入门
es数据库的英文全称为ElsticSearch,是位于Elastic Stack核心的分布式搜索和分析引擎。是一个由Apache开源的高扩展、全文检索和分析引擎(NoSQL数据库功能)的系统,它可以准实地快速存储、搜索、分析海量的数据。全文检索:全文检索是指计算机索引程序通过扫描文章中的每一个词,对
大数据技能大赛任务一:数据抽取
scala抽取mysql数据到hive
RabbitMQ--重试机制
本文介绍RabbitMQ的重试机制。
【大数据实时数据同步】超级详细的生产环境OGG(GoldenGate)12.2实时异构同步Oracle数据部署方案(上)
之前写过一系列关于GoldenGate异构同步Mysql、Kafka、Kylin、Flink做实时计算的场景文章。下面是我给大家的生产环境下,如何部署OGG(GoldenGate)12.2及异构实时同步数据的解决方案。本文主要介绍如何实现实时异构的进行Oracle->Oracle的数据同步,这种数据
【大数据实时数据同步】超级详细的生产环境OGG(GoldenGate)12.2实时异构同步Oracle数据部署方案(中)
本章介绍如何配置xagent远程GUI安装ogg,也可以用来当作xagent远程调用GUI的学习资料,之前写过一系列关于GoldenGate异构同步Mysql、Kafka、Kylin、Flink做实时计算的场景文章。下面是我给大家的生产环境下,如何部署GoldenGate及异构实时同步数据的解决方案
【SQL开发实战技巧】系列(十六):数据仓库中时间类型操作(初级)日、月、年、时、分、秒之差及时间间隔计算
日、月、年、时、分、秒之差及时间间隔计算。【SQL开发实战技巧】这一系列博主当作复习旧知识来进行写作,毕竟SQL开发在数据分析场景非常重要且基础,面试也会经常问SQL开发和调优经验,相信当我写完这一系列文章,也能再有所收获,未来面对SQL面试也能游刃有余~。本章介绍的关于时间的计算比较简单,主要是为
【大数据实时数据同步】超级详细的生产环境OGG(GoldenGate)12.2实时异构同步Oracle数据部署方案(下)
之前写过一系列关于GoldenGate异构同步Mysql、Kafka、Kylin、Flink做实时计算的场景文章。下面是我给大家的生产环境下,如何部署OGG(GoldenGate)12.2及异构实时同步数据(支持DDL)的解决方案。本文主要介绍如何实现实时异构的进行Oracle->Oracle的数据
spring-kafka整合
springboot-kafka