SeaTunnel安装及测试
SeaTunnel安装及测试
数据采集技术的方法有哪些?
pac
【机器学习之模型融合】Voting投票法基础理论
认识模型融合和投票法Voting
一文读懂TDengine的三种查询功能
为一款专业的时序数据库(Time Series Database,TSDB),为满足用户在不同场景下的查询需求,TDengine 提供了丰富的查询功能。除了一些主要的查询外,还包括多表聚合查询、降采样查询及连续查询,本文将从实际操作层面对这三种特殊查询进行解读。
ES选举:Elasticsearch中Master选举完全解读
Master选举的意义在于集群主节点在遭遇宕机时保障服务的可用性。理解选举机制及相关算法,有利于了解ES底层的高可用原理,并学习及借鉴其设计思想。理解`Master选举`的另一个重要原因是:其为 ES 常见面试题之一!本文我将结合Elasticsearch源码、文字、绘图的方式剖析Master选举的
Hive 分桶表及作用
**分区**提供一个隔离数据和优化查询的便利方式。不过,并非所有的数据集都可形成合理的分区。对于一张表或者分区,Hive 可以进一步组织成 ,也就是更为细粒度的数据范围划分;
【DataEase】零代码数据可视化分析工具的安装部署保姆级教程
近期,因为我要做大屏的数据可视化分析,所以我了解到了DataEase这一款数据可视化分析工具。这个工具和以往使用的echarts等图表库有和大的不同,它零代码就可以快速制作各种报表、仪表板,完成各种数据可视化以及工作汇报。官方并没有出这个工具的安装教程,只有一个文档。虽然大部分人看官方文档来安装也可
数据开发总结
涵盖较多面经
大数据必知必会之Kafka
Kafka 起初是 由 LinkedIn 公司采用 Scala 语言开发的一个多分区、多副本且基于 ZooKeeper 协调的分布式消息系统,现已被捐献给 Apache 基金会。目前 Kafka 已经定位为一个分布式流式处理平台,它以高吞吐、可持久化、可水平扩展、支持流数据处理等多种特性而被广泛使用
查看HDFS集群状态
通过UI界面查看hadoop运行状态
Hive拉链表
使用HQL写一个Hive On Tez任务,以便跑出拉链表数据
【实战讲解】数据血缘落地实施
在复杂的社会分工协作体系中,我们需要明确个人定位,才能更好的发挥价值,数据也是一样,于是,数据血缘应运而生。今天这篇文章会全方位的讲解数据血缘,并且给出具体的落地实施方案。........................
【AI 写作】《开发者思维:技术如何驱动企业的未来》全书目录、什么是开发者思维? 开发者思维与企业战略的关系?
开发者思维是指具备开发者所需的思维能力和习惯,能够熟练掌握各种开发工具和技能,能够认真分析问题、解决问题、优化问题的一种思维方式和状态。开发者思维的特点包括专注、严谨、创新、实践和团队合作能力。买馒头晚上老婆在做饭让我出去买几个馒头,去之前就要先确认:买几个?馒头没有了咋办?都没有了买啥?既然已经开
RSTP介绍
快速生成树协议RSTP(Rapid Spanning-Tree Protocol),RSTP在STP基础上进行了改进,实现了网络拓扑快速收敛。本文主要介绍RSTP的原理和配置
Kafka 集群安装
编辑config目录下的server.properties文件,在不同的节点只需要更改不同的host.name和broker.id。1. 将kafka安装包上传到服务器的/opt/apps目录下。5. 启动kafka(先启动zookeeper集群)二、安装zookeeper集群。到此kafka集群安
大数据系统架构-MPP数据库架构
MPP数据库架构
大数据Flink进阶(十):Flink集群部署
在Flink1.8版本后不再支持基于不同Hadoop版本的编译安装包,Flink与Hadoop进行整合时,需要在官网中下载对应的Hadoop版本的"flink-shaded-hadoop-2-uber-x.x.x-x.x.jar"jar包,然后后上传到提交Flink任务的客户端对应的$FLINK_H
林子雨大数据技术原理与运用期末复习
大数据预处理方法包括___数据清洗___、___数据集成_____、___数据变换___和___数据规约_____。
Vue生命周期钩子剖析(共12个钩子)
Vue生命周期钩子剖析,告别一知半解
Kafka集群部署与测试
Kafka集群部署与测试安装Kafka①、Alt+P 拷贝安装包 cd /opt/moduletar -zxvf /opt/software/kafka_2.11-2.0.0.tgz -C /opt/module/②、修改配置文件vi /opt/module/kafka_2.11-2.0.0/co