Hive环境搭建(保姆级教程)

Hive是基于Hadoop的一个数据仓库工具,可以将结构化的数据文件映射为一张数据库表,并提供类SQL查询功能,可以将SQL语句转换为MapReduce任务进行运行。本文将详细介绍Hive的本地安装模式的具体过程。

大数据Flink进阶(七):Flink批和流案例总结

a. 获取flink的执行环境,批和流不同,Execution Environment。b. 加载数据数据-- soure。c. 对加载的数据进行转换-- transformation。d. 对结果进行保存或者打印-- sink。e. 触发flink程序的执行 --env.execute()在Fli

如何用Redis实现分布式锁?

分布锁很重要,经常作为面试考题,接下来就让我们一起来了解下分布式锁

【Elasticsearch】Elasticsearch命令行操作

集群这一概念已经遍及天下了,在Elasticsearch中也不例外,可以将多台Elasticsearch节点组成集群使用,可以在任意一台节点上进行搜索。

phoenix连接hbase

phoenix简化hbase连接操作,对sql操更友好,能和spark、flink无缝对接,实在是海量数据操作的利器

Flink on-k8s operator application 模式

flink on k8s operator

Kafka快速入门(Kafka消费者)

Kafka 消费者1. Kafka 消费方式2 Kafka 消费者工作流程2.1 消费者总体工作流程2.2 消费者组原理Consumer Group(CG):消费者组,由多个consumer组成。形成一个消费者组的条件,是所有消费者的groupid相同。• 消费者组内每个消费者负责消费不同分区的数据

HBase集群部署

HBase要和hadoop的版本对应下载,否则做深层次任务会出问题。一、前期准备二、HBase下载1. 查看HBase与hadoop版本对应关系2. hbase的下载3. 将hbase的tar包上传到linux 下二、安装hbase1. 解压2. HBase的文件配置中还写的有一些内容,如果有的话删

k8s部署kafka集群

k8s 安装kafka集群

IDEA 中使用 Big Data Tools 连接大数据组件

简介Big Data Tools 插件可用于 Intellij Idea 2019.2 及以后的版本。它提供了使用 Zeppelin,AWS S3,Spark,Google Cloud Storage,Minio,Linode,数字开放空间,Microsoft Azure 和 Hadoop 分布式文

数据仓库与数据库的区别

通过数据分层管理可以简化数据清洗的过程,因为把原来一步的工作分到了多个步骤去完成,相当于把一个复杂的工作拆成了多个简单的工作,把一个大的黑盒变成了一个白盒,每一层的处理逻辑都相对简单和容易理解,这样我们比较容易保证每一个步骤的正确性,当数据发生错误的时候,往往我们只需要局部调整某个步骤即可。的过程,

Springboot+RabbitMQ+ACK机制(生产方确认(全局、局部)、消费方确认)、知识盲区

Springboot+RabbitMQ+ACK机制(生产方确认(全局、局部)、消费方确认)、知识盲区

Spark - 介绍及使用 Scala、Java、Python 三种语言演示

分布式机器学习的框架,可以使用许多常见的机器学习和统计算法,例如:支持向量机、 回归、 线性回归、 逻辑回归、 决策树、 朴素贝叶斯、汇总统计、相关性、分层抽样、 假设检定、随即数据生成等,简化大规模机器学习。的快速调度能力来运行流分析,通过时间窗口截取小批量的数据并可以对之运行。类似,Spark

Doris进阶——初识Doris_FE、BE、BROKER的扩缩容

Doris的简单介绍以及FE、BE、BROKER的扩缩容

Hadoop3 - HDFS DataNode 动态扩容和缩容

已有HDFS集群容量已经不能满足存储数据的需求,需要在原有集群基础上动态添加新的DataNode节点。节点已经上线,但没有数据块的存储,使得集群整体来看负载不均衡。DataNode 缩容,不像扩容那样启动一个节点即可, 缩容还需要把当前节点数据移出去才可以,:旧的服务器需要进行退役更换,暂停服务,需

docker 安装Es

docker 安装Es包含配置文件命令

心跳信号分类预测(天池数据集)

心跳信号分类预测处理分享

Elasticsearch漏洞汇总比较全

本测试环境同时运行了Tomcat和ElasticSearch,Tomcat目录在/usr/local/tomcat,web目录是/usr/local/tomcat/webapps;之后的新版,配置文件elasticsearch.yml中必须存在path.repo,该配置值为一个目录,且该目录必须可写

数学规划(Python cvxpy、scipy.optimize)

数学规划学习笔记

登录可以使用的更多功能哦! 登录
作者榜
...
资讯小助手

资讯同步

...
内容小助手

文章同步

...
Deephub

公众号:deephub-imba

...
奕凯

公众号:奕凯的技术栈