Hive环境搭建(保姆级教程)
Hive是基于Hadoop的一个数据仓库工具,可以将结构化的数据文件映射为一张数据库表,并提供类SQL查询功能,可以将SQL语句转换为MapReduce任务进行运行。本文将详细介绍Hive的本地安装模式的具体过程。
大数据Flink进阶(七):Flink批和流案例总结
a. 获取flink的执行环境,批和流不同,Execution Environment。b. 加载数据数据-- soure。c. 对加载的数据进行转换-- transformation。d. 对结果进行保存或者打印-- sink。e. 触发flink程序的执行 --env.execute()在Fli
流批一体计算引擎-7-[Flink]的DataStream连接器
DataStream连接器
如何用Redis实现分布式锁?
分布锁很重要,经常作为面试考题,接下来就让我们一起来了解下分布式锁
【Elasticsearch】Elasticsearch命令行操作
集群这一概念已经遍及天下了,在Elasticsearch中也不例外,可以将多台Elasticsearch节点组成集群使用,可以在任意一台节点上进行搜索。
phoenix连接hbase
phoenix简化hbase连接操作,对sql操更友好,能和spark、flink无缝对接,实在是海量数据操作的利器
Flink on-k8s operator application 模式
flink on k8s operator
Kafka快速入门(Kafka消费者)
Kafka 消费者1. Kafka 消费方式2 Kafka 消费者工作流程2.1 消费者总体工作流程2.2 消费者组原理Consumer Group(CG):消费者组,由多个consumer组成。形成一个消费者组的条件,是所有消费者的groupid相同。• 消费者组内每个消费者负责消费不同分区的数据
HBase集群部署
HBase要和hadoop的版本对应下载,否则做深层次任务会出问题。一、前期准备二、HBase下载1. 查看HBase与hadoop版本对应关系2. hbase的下载3. 将hbase的tar包上传到linux 下二、安装hbase1. 解压2. HBase的文件配置中还写的有一些内容,如果有的话删
k8s部署kafka集群
k8s 安装kafka集群
IDEA 中使用 Big Data Tools 连接大数据组件
简介Big Data Tools 插件可用于 Intellij Idea 2019.2 及以后的版本。它提供了使用 Zeppelin,AWS S3,Spark,Google Cloud Storage,Minio,Linode,数字开放空间,Microsoft Azure 和 Hadoop 分布式文
数据仓库与数据库的区别
通过数据分层管理可以简化数据清洗的过程,因为把原来一步的工作分到了多个步骤去完成,相当于把一个复杂的工作拆成了多个简单的工作,把一个大的黑盒变成了一个白盒,每一层的处理逻辑都相对简单和容易理解,这样我们比较容易保证每一个步骤的正确性,当数据发生错误的时候,往往我们只需要局部调整某个步骤即可。的过程,
Springboot+RabbitMQ+ACK机制(生产方确认(全局、局部)、消费方确认)、知识盲区
Springboot+RabbitMQ+ACK机制(生产方确认(全局、局部)、消费方确认)、知识盲区
Spark - 介绍及使用 Scala、Java、Python 三种语言演示
分布式机器学习的框架,可以使用许多常见的机器学习和统计算法,例如:支持向量机、 回归、 线性回归、 逻辑回归、 决策树、 朴素贝叶斯、汇总统计、相关性、分层抽样、 假设检定、随即数据生成等,简化大规模机器学习。的快速调度能力来运行流分析,通过时间窗口截取小批量的数据并可以对之运行。类似,Spark
Doris进阶——初识Doris_FE、BE、BROKER的扩缩容
Doris的简单介绍以及FE、BE、BROKER的扩缩容
Hadoop3 - HDFS DataNode 动态扩容和缩容
已有HDFS集群容量已经不能满足存储数据的需求,需要在原有集群基础上动态添加新的DataNode节点。节点已经上线,但没有数据块的存储,使得集群整体来看负载不均衡。DataNode 缩容,不像扩容那样启动一个节点即可, 缩容还需要把当前节点数据移出去才可以,:旧的服务器需要进行退役更换,暂停服务,需
docker 安装Es
docker 安装Es包含配置文件命令
心跳信号分类预测(天池数据集)
心跳信号分类预测处理分享
Elasticsearch漏洞汇总比较全
本测试环境同时运行了Tomcat和ElasticSearch,Tomcat目录在/usr/local/tomcat,web目录是/usr/local/tomcat/webapps;之后的新版,配置文件elasticsearch.yml中必须存在path.repo,该配置值为一个目录,且该目录必须可写
数学规划(Python cvxpy、scipy.optimize)
数学规划学习笔记