Flink状态容错savepoint与checkpoint

本文目录

Checkpoints- State Backends
Savepoints
Checkpoints 与 Savepoints区别

Flink可以保证exactly once，与其容错机制checkpoint和savepoint分不开的。本文主要讲解两者的机制与使用，同时会对比两者的区别。

Checkpoints

Checkpoint 使 Flink 的状态具有良好的容错性，通过 checkpoint 机制，Flink 可以对作业的状态和计算位置进行恢复。Flink 中的每个方法或算子都能够是有状态的，状态化的方法在处理单个元素/事件的时候存储数据，让状态成为使各个类型的算子更加精细的重要部分。为了让状态容错，Flink 需要为状态添加 checkpoint（检查点）。Checkpoint 使得 Flink 能够恢复状态和在流中的位置，从而向应用提供和无故障执行时一样的语义。

Flink 的 checkpoint 机制会和持久化存储进行交互，读写流与状态。一般需要：

一个能够回放一段时间内数据的持久化数据源，例如持久化消息队列（例如 Apache Kafka、RabbitMQ、 Amazon Kinesis、 Google PubSub 等）或文件系统（例如 HDFS、 S3、 GFS、 NFS、 Ceph 等）。
存放状态的持久化存储，通常为分布式文件系统（比如 HDFS、 S3、 GFS、 NFS、 Ceph 等）。

1.

标签： flink 大数据

本文转载自: https://blog.csdn.net/ddxygq/article/details/135353942
版权归原作者 大数据技术派 所有，如有侵权，请联系我们删除。

Flink状态容错savepoint与checkpoint

Checkpoints

1.

发表评论

“Flink状态容错savepoint与checkpoint”的评论:

关于作者

overfit同步小助手

相关阅读

文章导航