0


flink第一课(详细理论)--体系架构

Flink的体系架构基本上可以分为三层,由上往下依次是API & Libraries层、Runtime核心层以及物理部署层。

API & Libraries层作为分布式数据处理框架,Flink同时提供了支撑流计算和批计算的接口,并在此基础之上抽象出不同的应用类型的组件库,如基于流处理的CEP(复杂事件处理库)、SQL&Table库和基于批处理的FlinkML(机器学习库)等、Gelly(图处理库)等。

另外,Flink整个系统主要由两个组件组成,分别为JobManager和TaskManager。Flink架构也遵循Master-Slave架构设计原则,其中JobManager为Master节点,TaskManager为Worker(Slave)节点。

总的来说,Flink的体系架构非常灵活和可扩展,能够适应不同的数据处理需求和应用场景。


01 Flink简介


Flink是什么?


实时数据分析一直是个热门话题,需要实时数据分析的场景也越来越多,如金融支付中的风控、基础运维中的监控告警、实时大盘之外,AI模型也需要消费更为实时的聚合结果来达到很好的预测效果。


Apache Flink是下一代开源大数据处理引擎。它是一个分布式大数据处理引擎,可对有限数据流和无限数据流进行有状态计算。可部署在各种集群环境,对各种大小的数据规模进行快速计算。

Flink特性

Apache Flink 为用户提供了更强大的计算能力和更易用的编程接口:

(1) 批流统一。Flink在Runtime和SQL层批流统一,提供高吞吐低延时计算能力和更强大的SQL支持。

(2) 生态兼容。Flink能与Hadoop Yarn / Apache Mesos / Kubernetes集成,并且支持单机模式运行。

(3) 性能卓越。Flink提供了性能卓越的批处理与流处理支持。

(4) 规模计算。Flink的作业可被分解成上千个任务,分布在集群中并发执行。

Flink已经被证明可以扩展到数千个内核和TB级的应用程序状态,提供高吞吐量和低延迟,并支持世界上一些要求最高的流处理应用程序


02Flink应用场景


Fl

标签: flink 架构 大数据

本文转载自: https://blog.csdn.net/m0_73691529/article/details/136377417
版权归原作者 我们再向前走走吧 所有, 如有侵权,请联系我们删除。

“flink第一课(详细理论)--体系架构”的评论:

还没有评论