Flink 学习八 Flink 容错机制 & checkpoint & savepoint
flink checkpoint savepoint 基础概念和使用
【大数据】Flink 详解(七):源码篇 Ⅱ
调度器是 Flink 作业执行的核心组件,管理作业执行的所有相关过程,包括 JobGraph 到 ExecutionGraph 的转换、作业生命周期管理(作业的发布、取消、停止)、作业的 Task 生命周期管理(Task 的发布、取消、停止)、资源申请与释放、作业和 Task 的 Faillover
flink入门-流处理
flink入门-流处理
大数据Flink(五十九):Flink on Yarn的三种部署方式介绍以及注意
如果使用的是flink on yarn方式,想切换回standalone模式的话,需要删除文件:【/tmp/.yarn-properties-root】到这里,我们以 Pre-Job 的方式成功部署了 PyFlink 的作业!但是会话模式的话,如果是kill掉任务,其不会执行自动删除这个文件的步骤,
如何控制Flink代码运行时控制日志级别
在Flink程序中,可以通过设置日志级别来控制控制台输出的信息。要让控制台只打印结果信息,可以将日志级别设置为。,并将日志输出到控制台。在这种配置下,控制台将只显示错误信息和。,并将日志输出到控制台。在这种配置下,控制台将只显示错误信息和。的文件(如果已经存在,请修改相应的配置)。要设置日志级别,请
深入解读 Flink 1.17
摘要:本文整理自阿里云技术专家,Apache Flink PMC Member & Committer、Flink CDC Maintainer 徐榜江(雪尽) 在深入解读 Flink 1.17 Meetup 的分享。
十八、Flink自定义多并行Source
Flink自定义多并行Source
Flink - sink算子
Flink中常见的sink算子,对接Kafka、Redis、ES、自定义sink、jdbc sink。案例代码使用。
浏览器连不上 Flink WebUI 8081 端口
【代码】浏览器连不上 Flink WebUI 8081 端口。
FLinkSQL+FlinkCDC
FlinkCDC(standalone模式)读取mysqlBinlog
flink 从savepoint、checkpoint中恢复数据
flink作业因为故障导致restart strategy失败或升级flink版本重新发布任务,这时就需要从最近的checkpoint恢复。一般而言有两种方案,第一种方案是开启checkpoint且任务取消时不删除checkpoint(调整参数execution.checkpointing.exte
十二、Flink自定义 FlatMap 方法
Flink自定义FlatMap方法
RocksDB简介及Flink对其的支持——大数据
在大数据处理框架中,如Flink,RocksDB作为其默认的状态后端,能够保证高效的状态管理和容错恢复能力。Flink借助RocksDB的特性来管理作业的中间结果和状态,并保证在故障恢复时状态数据的一致性和可恢复性。在上面的示例中,我们首先创建了一个StreamExecutionEnvironmen
flink执行任务运行10h以后挂掉并且报错
我觉得可能是1、因为代码错误运行时间长了有bug,这个是最有可能的(90%) 当时默认的内存是1G,不可能存在着内存不够的原因。我用了hadoop的集群的yarn,以及分析了taskmanager和jobmanager的内存大小、以及分析每个错误的原因。2、没仔细分析Log日志,很多时候想要节省
flink cdc DataStream api 时区问题
这里主要使用第二种方式。/*** 处理Debezium时间转换的问题* Debezium默认将MySQL中datetime类型转成UTC的时间戳({@link io.debezium.time.Timestamp }) ,时区是写死的无法更改,* 导致数据库中设置的UTC+8,到kafka中变成了多
Flink 两阶段提交(Two-Phase Commit)协议
flink两阶段提交
Flink Sql光速入门
flink sql很简单,只要会sql就会写实时应用报表
流数据湖平台Apache Paimon(二)集成 Flink 引擎
Paimon目前支持Flink 1.17, 1.16, 1.15 和 1.14。本课程使用Flink 1.17.0。环境准备1)上传并解压Flink安装包tar -zxvf flink-1.17.0-bin-scala_2.12.tgz -C /opt/module/2)配置环境变量sudo vim
Flink SQL之常用函数(二)
例如:select CURRENT_DATE;返回 2021-10-08例如:select CURRENT_TIME;返回 09:25:28.137例如:select CURRENT_TIMESTAMP;返回 2021-10-08T09:23:15.180 --注意和时区有关系例如:select
Flink的部署模式:Local模式、Standalone模式、Flink On Yarn模式
Local模式、Standalone模式和FlinkonYARN模式是Flink的三种常见部署模式。