Flink - overfit.cn

FlinkSql使用ES sink并指定主键，为什么数据还是会被覆盖？

源码基于flink 1.14.4根据官方文档中对自定义sink的描述，connector sink的的工作原理如下元数据的内容由create table语句所定义，通过的实例表示，该实例表示Catalog中未解析的元数据，包含可以在create table语句中表示的所有特征，框架将其解析为实例（一

overfit同步小助手 2024-05-25 01:03:51 0 收藏

【flink配置系列】FLink配置大全

所有配置都在`conf/flink-conf.yaml`中完成，这个文件应该是一个扁平的[YAML键值对](http://www.yaml.org/spec/1.2/spec.html)集合，格式为`key: value`。配置在Flink进程启动时被解析和评估。对配置文件的更改需要重新启动相关的进

overfit同步小助手 2024-05-25 01:03:46 0 收藏

Python实战：Python在实时数据流处理中的Flink与Kafka集成

Flink和Kafka是实时数据流处理领域的两个关键技术。Flink是一个流处理框架，用于实时处理和分析数据流，而Kafka是一个分布式流处理平台，用于构建实时数据管道和应用程序。

overfit同步小助手 2024-05-24 20:05:00 0 收藏

Flink RocksDB状态后端优化总结

截至当前，Flink 作业的状态后端仍然只有 Memory、FileSystem 和 RocksDB 三种可选，且 RocksDB 是状态数据量较大（GB 到 TB 级别）时的唯一选择。RocksDB 的性能发挥非常仰赖调优，如果全部采用默认配置，读写性能有可能会很差。但是，RocksDB 的配置也

overfit同步小助手 2024-05-24 17:04:07 0 收藏

（文章整理）追源索骥：透过源码看懂Flink核心框架的执行流程

flink源码分析文章整理

overfit同步小助手 2024-05-24 17:03:55 0 收藏

Flink面试（2）

1) CheckpointCoordinator(检查点协调器) 周期性的向该流应用的所有source算子发送 barrier(屏障)。2) 当某个source算子收到一个barrier时，便暂停数据处理过程，然后将自己的当前状态制作成快照，并保存到指定的持久化存储中，最后向CheckpointCo

overfit同步小助手 2024-05-24 15:04:09 0 收藏

Flink CDC整库同步

overfit同步小助手 2024-05-24 15:03:48 0 收藏

大数据学习之Flink，了解Flink的多种部署模式

应用模式是对单作业模式的优化，不管是会话模式还是单作业模式，代码都是在客户端是进行执行的，然后由客户端提交给JobManager的，这种方式下客户端会比较耗资源，因为需要下载依赖和发送二进制文件到JobManager。会话模式就是在作业提交之前通过启动集群并创建会话，我们通过这个会话提交任务，所有的

overfit同步小助手 2024-05-24 14:04:16 0 收藏

Flink源码分析(5)JobMaster启动源码分析

Flink JobMaster源码启动入口从Dispatcher.runJob()方法处开始，下面让我们一起进入到JobMaster的源码分析中。这里启动jobmaster服务，注册心跳同时创建了监听服务，在jobmaster内部创建了slotpool，用于维护整个任务的资源。内执行了jobgr

overfit同步小助手 2024-05-24 13:04:09 0 收藏

Flink Stream API实践

overfit同步小助手 2024-05-24 12:03:56 0 收藏

Flink 生态对 Confluent / Kafka Schema Registry 支持情况的研究报告

这几年，在流式链路上引入一个 Schema Registry 变得越来越流行，也越来越有必要， Schema Registry 能有效控制 Schema 的变更，合理推进 Schema Evolution，同时，引入它以后还能有效精简消息内容（特别是针对 Avro 格式），提升消息的传输效率，所以引

overfit同步小助手 2024-05-24 12:03:34 0 收藏

【大数据面试】Flink面试题附答案

1、背压问题2、Flink是如何支持批流一体的3、Flink任务延迟高，想解决这个问题，你会如何入手4、Flink的监控页面，有了解吗，主要关注那些指标？5、你们之前Flink集群规模有多大？部署方式是什么？你了解哪些部署方式？6、Flink如何做压测和监控7、Flink checkpoint 的相

overfit同步小助手 2024-05-24 10:03:55 0 收藏

使用Flink SQL实时入湖Hudi/Hive

Hudi是一个流式数据湖平台，使用Hudi可以直接打通数据库与数据仓库，Hudi可以连通大数据平台，支持对数据的增删改查。Hudi支持同步数据入库，提供了事务保证、索引优化，是打造实时数仓、实时湖仓一体的新一代技术。下面以我实际工作中遇到的问题，聊下湖仓一体的好处，如有不对，敬请指正。

overfit同步小助手 2024-05-24 08:04:16 0 收藏

阿里巴巴瓴羊基于 Flink 实时计算的优化和实践

本⽂整理⾃阿里云智能集团技术专家王柳焮⽼师在 Flink Forward Asia 2023 中平台建设专场的分享。

overfit同步小助手 2024-05-24 04:03:43 0 收藏

Flink WordCount实践

overfit同步小助手 2024-05-24 02:03:59 0 收藏

云粒智慧实时数仓的架构演进分享：OceanBase + Flink CDC

4月20日，在2024 OceanBase开发者大会上，云粒智慧的高级技术专家付大伟，分享了云粒智慧实时数仓的构建历程。他讲述了如何在传统数仓技术框架下的相关努力后，选择了OceanBase + Flink CDC架构的实时数仓演进历程。

overfit同步小助手 2024-05-24 00:04:32 0 收藏

Flink CDC 整库 / 多表同步至 Kafka 方案（附源码）

我们此前介绍的一些 CDC 开箱即用方案往往都是一张表对应一条独立的链路（作业），需要一个独立的数据库连接，在表数量很大的情况下，会对数据库造成很大压力，同时过多的 Flink 作业会不易于管理和维护，为众多小表创建独立的采集作业也浪费了资源。此外，使用 Flink SQL 针对每张表定义 CDC

overfit同步小助手 2024-05-23 22:04:44 0 收藏

海豚调度系列之：任务类型——Flink节点

本案例为大数据生态中常见的入门案例，常应用于 MapReduce、Flink、Spark 等计算框架。主要为统计输入的文本中，相同的单词的数量有多少。若生产环境中要是使用到 flink 任务类型，则需要先配置好所需的环境。在使用 Flink 任务节点时，需要利用资源中心上传执行程序的 jar 包。F

overfit同步小助手 2024-05-23 22:04:41 0 收藏

Flink窗口理论到实践 | 大数据技术

⭐⭐个人主页🔎哆啦A梦撩代码🎉欢迎关注🔎👍⭐️留言📝

overfit同步小助手 2024-05-23 22:04:34 0 收藏

Seal^_^【送书活动第2期】——《Flink入门与实战》

overfit同步小助手 2024-05-23 21:04:21 0 收藏