基于 Flink CDC 高效构建入湖通道
本文整理自阿里云 Flink 数据通道负责人、Flink CDC 开源社区负责人, Apache Flink PMC Member & Committer 徐榜江(雪尽),在 Streaming Lakehouse Meetup 的分享。内容主要分为四个部分: 1. Flink CDC 核心技
[实战-04]FlinkSql 如何实现数据去重?
很多时候flink消费上游kafka的数据是有重复的,因此有时候我们想数据在落盘之前进行去重,这在实际开发中具有广泛的应用场景,此处不说详细代码,只粘贴相应的flinksql。
flink streamload写入doris
详细介绍了基于flink 1.16的各种写入方式,本文主要介绍的是基于flink 1.13的RowData 数据流(RowDataSerializer)写入
增加并行度后,发现Flink窗口不会计算的问题。
窗口没有关闭计算的问题,一直困扰了很久,经过多次验证,确定了问题的根源。是因为多个topic进行了数据消费,其中有个topic数据会进入窗口进行计算,但有的窗口又永远不会有数据进入计算,这就造成对应的窗口永远没有最低的watermark以致于窗口无法关闭并计算
源码解析FlinkKafkaConsumer支持punctuated水位线发送
Punctuated水位线生成源码解析
flink-cdc之读取mysql变化数据
由于打印的日志太多 我们可以用fastjson稍微封装下 然后传给sink去处理,根据update delete insert实时更新下游数据。修改一条数据 age=1 ->age=2。
【基础篇】三、Flink集群角色、系统架构以及作业提交流程
TaskManager是Flink中的工作进程,数据流的具体计算就是它来做的。需要注意在早期版本的Flink中,没有JobMaster的概念,而JobManager的概念范围较小,实际指的就是现在所说的JobMaster。这里的ResourceManager是Flink内置的资源管理组件,和其他资源
Flink SQL Hive Connector使用场景
本文基于FLink1.16讨论,Apache Flink Hive Connector提供了Flink与Hive的集成,主要用于在Flink中读取和写入Hive数据
Flink学习之旅:(三)Flink源算子(数据源)
大多数情况下,前面几个数据源已经满足需求了。但是遇到特殊情况我们需要自定义的数据源。实现方式如下:1.编辑自定义源Source/***//**** 主要实现2个方法 run() 和 cancel()*/// 声明一个布尔变量,作为控制数据生成的标识位@Override// 在指定的数据集中随机选取数
Flink实现kafka到kafka、kafka到doris的精准一次消费
【代码】Flink实现kafka到kafka、kafka到doris的精准一次消费。
Flink之常用处理函数
处理函数Processing Function是Apache Flink中用于对数据流上的元素进行处理的核心组件之一。处理函数负责定义数据流上的数据如何被处理,允许开发人员编写自定义逻辑以执行各种操作,如转换、聚合、筛选、连接等,并在处理后生成输出数据流。
Flink---14、Flink SQL(SQL-Client准备、流处理中的表、时间属性、DDL)
Flink SQL(SQL-Client准备、流处理中的表、时间属性、DDL)
Flink写入数据到ClickHouse
使用Flink将流式数据写入到ClickHouse
【Flink实战】Flink 商品销量统计-实战Bahir Connetor实战存储 数据到Redis6.X
Redis环境说明 redis6使用docker部署redis6.x 看个人主页docker相关文章编码实战数据源static {list.add("spring boot2.x课程");list.add("微服务SpringCloud课程");list.add("RabbitMQ消息队列");l
【基础篇】四、本地部署Flink
独立部署就是独立运行,即Flink自己管理Flink资源,不依靠任何外部的资源管理平台,比如K8S或者Hadoop的Yarn,当然,独立部署的代价就是:如果资源不足,或者出现故障,没有自动扩展或重分配资源的保证,必须手动处理,生产环境或者作业量大的场景下不建议采用独立部署。应用模式与单作业模式,都是
17、Flink 之Table API: Table API 支持的操作(1)
1、Flink 部署、概念介绍、source、transformation、sink使用示例、四大基石介绍和示例等系列综合文章链接13、Flink 的table api与sql的基本概念、通用api介绍及入门示例14、Flink 的table api与sql之数据类型: 内置数据类型以及它们的属性1
Flink SQL 窗口聚合详解
Flink SQL 窗口聚合详解
Flink on yarn 加载失败plugins失效问题解决
flink 任务运行在yarn集群,plugins加载失效问题
Flink之FileSink将数据写入parquet文件
Flink写入数据到Parquet文件