Flink系列 - overfit.cn

Flink系列之：学习理解通过状态快照实现容错

由 Flink 管理的 keyed state 是一种分片的键/值存储，每个 keyed state 的工作副本都保存在负责该键的 taskmanager 本地中。Checkpoint n 将包含每个 operator 的 state，这些 state 是对应的 operator 消费了严格在 ch

overfit同步小助手 2024-11-26 18:03:13 0 收藏

Flink系列之：Flink SQL Gateway

SQL Gateway 捆绑在常规 Flink 发行版中，因此可以开箱即用。它只需要一个正在运行的Flink集群，可以在其中执行表程序。根据端点的类型，用户可以使用不同的实用程序进行连接。凭借灵活的架构，用户可以通过调用来启动具有指定端点的SQL Gateway。注意：如果 Flink 配置文件中还

overfit同步小助手 2024-06-15 20:03:21 0 收藏

Flink系列之：Apache Kafka SQL 连接器

例如在 SQL client JAR 中，Kafka client 依赖被重置在了 org.apache.flink.kafka.shaded.org.apache.kafka 路径下，因此 plain 登录模块的类路径应写为 org.apache.flink.kafka.shaded.org.a

overfit同步小助手 2024-02-15 15:03:48 0 收藏

Flink系列之：Table API Connectors之Raw Format

然后，你可以将原始数据读取为纯字符串，之后使用用户自定义函数将其分为多个字段进行进一步分析。例如示例中的 my_split。相对应的，你也可以将一个 STRING 类型的列以 UTF-8 编码的匿名字符串值写入 Kafka topic。例如，你可能在 Kafka 中具有原始日志数据，并希望使用 F

overfit同步小助手 2024-01-30 19:03:14 0 收藏

Flink系列之：Upsert Kafka SQL 连接器

更准确地说，数据记录中的 value 被解释为同一 key 的最后一个 value 的 UPDATE，如果有这个 key（如果不存在相应的 key，则该更新被视为 INSERT）。总之，这段代码的作用是通过Kafka连接器创建两个表，并将"pageviews"表中的数据计算出每个地区的pv和uv，并

overfit同步小助手 2024-01-25 12:03:49 0 收藏

Flink系列之：Table API Connectors之JSON Format

为了使用 Json 格式，使用构建自动化工具（例如 Maven 或 SBT）的项目和带有 SQL JAR 包的 SQL 客户端都需要以下依赖项。JSON Format 能读写 JSON 格式的数据。当前，JSON schema 是从 table schema 中自动推导而得的。不支持显式地定义 JS

overfit同步小助手 2024-01-20 08:03:20 0 收藏

Flink系列之：深入理解ttl和checkpoint，Flink SQL应用ttl案例

通过保存作业状态的快照，Flink能够保证作业的一致性，并提供了高可用性和高效率的保存和恢复机制。冷启动和部署：可以使用检查点来实现作业的冷启动，即在作业启动时，从最近的检查点恢复状态和数据，并从上一次检查点的位置继续处理。当窗口中的数据过期时，Flink会自动丢弃这些数据，从而保持窗口中的数据只包

overfit同步小助手 2024-01-11 10:03:30 0 收藏

Flink系列之：Table API Connectors之Debezium

这也意味着，在非正常情况下，Debezium 可能会投递重复的变更事件到 Kafka 中，当 Flink 从 Kafka 中消费的时候就会得到重复的事件。请使用 debezium-avro-confluent 来解析 Debezium 的 Avro 消息，使用 debezium-json 来解析 D

overfit同步小助手 2024-01-08 03:03:44 0 收藏

Flink系列之：Checkpoints 与 Savepoints

从概念上讲，Flink 的 savepoints 与 checkpoints 的不同之处类似于传统数据库系统中的备份与恢复日志之间的差异。Checkpoints 的主要目的是为意外失败的作业提供恢复机制。Checkpoint 的生命周期由 Flink 管理，即 Flink 创建，管理和删除 ch

overfit同步小助手 2024-01-05 04:03:50 0 收藏

Flink系列之：背压下的检查点

然而，当 Flink 作业正运行在严重的背压下时，Checkpoint 端到端延迟的主要影响因子将会是传递 Checkpoint Barrier 到所有的算子/子任务的时间。在启动时，每个 Checkpoint 仍然是 aligned checkpoint，但是当全局 Checkpoint 持续时

overfit同步小助手 2024-01-03 10:04:26 0 收藏

Flink系列之：Elasticsearch SQL 连接器

Elasticsearch 将文档存储在 JSON 字符串中。因此数据类型映射介于 Flink 数据类型和 JSON 数据类型之间。Flink 为 Elasticsearch 连接器使用内置的 ‘json’ 格式。下表列出了 Flink 中的数据类型与 JSON 中的数据类型的映射关系。

overfit同步小助手 2024-01-02 06:03:43 0 收藏

Flink系列之：JDBC SQL 连接器

在 Flink 中，当查询由 Postgres catalog 注册的表时，用户可以使用 schema_name.table_name 或只有 table_name，其中 schema_name 是可选的，默认值为 “public”。在 Flink 中，当查询由 MySQL catalog 注册的表

overfit同步小助手 2023-12-27 20:03:46 0 收藏