【大数据实战】你真的了解 Clickhouse 投影吗?
🔔 近几年 Clickhouse 在大数据场景下表现非常不错,应用也越来越广,从事大数据场景开发的同学都可以学起来。目前我们系统已经通过它存储几十亿的数据了,性能依旧杠杠的。
Docker (CentOS)配置rabbitMQ 服务器访问15672端口显示服务器拒绝连接
2、你的服务器安全组没有添加该端口,去你的服务器的安全组开放即可(以下以我的服务器为例 阿里服务器)点击安全组 -> 配置规则即可。在自己的服务器上配置rabbitMq时已经启动成功了,但是访问就是出错。那么有三种可能性:1、你的防火墙端口没有开放 使用命令开放端口。3、rabbitMQ的web插件
jps命令
当Hadoop集群中出现故障时,可以通过jps命令来查找故障的进程,并排除故障。
docker-compose安装kafka、zookeeper
将docker-compose.yml放到 /docker 目录,目录下执行。#安装docker-compose,(下载好docker-compose)#将 docker-compose 移动到相应目录。#创建kafka目录。
[Hive的基本概念之---数据库 ]
《咏柳》唐·贺知章碧玉妆成一树高,万条垂下绿丝绦。不知细叶谁裁出,二月春风似剪刀。
Flink生产数据到kafka
Flink程序生产数据至kafka。
CDH6.3.2-组件安装&安全认证
CDH6.3.2-组件安装&安全认证
Kafka
先进入kafka安装目录 bin下。
ElasticSearch第十五讲 ES数据写入过程和写入原理以及数据如何保证一致性
ElasticSearch第十五讲 ES数据写入过程和写入原理以及数据如何保证一致性
大数据技术之Hadoop学习(七)——Hive数据仓库
Hive数据仓库的认识与操作
从0到1搭建数据仓库流程
数仓搭建流程
GateUpdate楚楚留香网关数据记录分析
作者针对ServerTools的数据加载进行了全方位的分析,何为数据分析?数据分析是指用适当的统计分析方法对收集来的大量数据进行分析,将它们加以汇总和理解并消化,以求相对完整地开发数据的功能,发挥数据的作用。数据分析是为了提取有用信息和形成结论而对数据加以详细研究和概括总结的过程。数据分析的数学基础
Flink CDC2.4 整库实时同步MySql 到Doris
mysql 到doris的数据、表结构实时同步
hive之正则函数研究学习regex/regex_replace/regex_extract
首先学习这个之前要先知道一些正则的基本知识。随便百度一下将下一个字符标记为一个特殊字符、或一个原义字符、或一个 向后引用、或一个八进制转义符。例如,'n' 匹配字符 "n"。'\n' 匹配一个换行符。序列 '\\' 匹配 "\" 而 "\(" 则匹配 "("。匹配输入字符串的开始位置。如果设置了 R
全国范围2012-2022年POI数据集(shp格式)
中国五批国家级非物质文化遗产空间分布数据集是基于国务院2006、2008、2011、2014和2021年先后五次发布的3610个国家级非物质文化遗产代表性项目名录,按申报地区或单位的空间地理位置研发的数据集。该数据集包括3610个非遗项目的地理位置、编号、名称、类别、公布时间、类型、申报地区或单位、
9、Elasticsearch7.6.1 ES与HDFS相互转存数据-ES-Hadoop
ES-Hadoop是Elasticsearch推出的专门用于对接Hadoop生态的工具,可以让数据在Elasticsearch和Hadoop之间双向移动,无缝衔接Elasticsearch与Hadoop服务,充分使用Elasticsearch的快速搜索及Hadoop批处理能力,实现交互式数据处理。本
Hive--清除/删除Hive表数据
大数据技术指的是用于处理、分析和管理大规模数据集的技术和工具。随着互联网和物联网的普及,数据量不断增大,对数据的处理和分析需求也日益增加,大数据技术应运而生
大数据入门之Presto/Trino
Presto是由Facebook开发的分布式sql查询引擎,用来进行高速、实时的数据查询。
JAVA中Kafka配置
【代码】JAVA中Kafka配置。
hadoop -- Yarn资源管理
Container是YARN中的资源抽象,它封装了某个节点上的多维度资源,如内存、CPU、磁盘、网络等,当AM向RM申请资源时,RM为AM返回的资源便是用Container表示。NM是每个节点上的资源和任务管理器,一方面,它会定时地向RM汇报本节点上的资源使用情况和各个Container的运行状态;