大数据 Flink - overfit.cn

Flink 开发工程应加载哪些依赖

讲解flink打包时依赖相关配置

overfit同步小助手 2024-12-14 00:03:42 0 收藏

SpringBoot集成Flink-CDC

Flink CDCCDC相关介绍CDC是什么?CDC是Change Data Capture(变更数据获取)的简称。核心思想是，监测并捕获数据库的变动（包括数据或数据表的插入、更新以及删除等），将这些变更按发生的顺序完整记录下来，写入到MQ以供其他服务进行订阅及消费CDC分类CDC主要分为基于查询和

overfit同步小助手 2024-12-13 19:03:45 0 收藏

Flink任务开发：从代码编写到集群提交

通过本文的介绍，我们了解了Flink任务开发的基本流程，包括使用DataStream API进行编码、打包上传以及提交任务的两种方式。在实际应用中，可以根据具体的业务需求，灵活运用Flink的各种功能和特性，构建高效、可靠的大数据处理应用。同时，需要注意Flink版本的兼容性以及相关依赖的管理，以确

overfit同步小助手 2024-12-13 09:04:22 0 收藏

flink cdc mysql pipeline connector参数scan.startup.mode解读

在 Flink CDC 中，参数用于指定启动时从哪个位置开始读取数据。initial：这是默认的启动模式。当你首次启动 CDC 任务时，它会从最早的可用 binlog 位置开始读取数据，并执行一个初始快照，然后继续读取最新的 binlog。：如果你希望 CDC 在每次启动时从最新的 binlog 位

overfit同步小助手 2024-12-13 06:03:31 0 收藏

Flink四大基石之CheckPoint(检查点) 的使用详解

在大数据流式处理领域，Apache Flink 凭借其卓越的性能和强大的功能占据重要地位。而理解 Flink 中的 Checkpoint（检查点）、重启策略以及 SavePoint（保存点）这些关键概念，对于保障流处理任务的稳定性、容错性以及可维护性至关重要。本文将深入剖析它们的原理、用法，并结合实

overfit同步小助手 2024-12-13 00:03:41 0 收藏

【Flink】-- flink新版本发布：v2.0-preview1

Apache Flink 社区已于2024-10-23发布了 Flink 2.0版本，这是自 Flink 1.0 发布以来的首个重大更新。Flink 2.0 将引入多项激动人心的功能和改进，包括存算分离状态管理、物化表、批作业自适应执行等，同时也包含了一些不兼容的变更。目前提供的预览版旨在让用户提前

overfit同步小助手 2024-12-12 06:04:02 0 收藏

Flink CDC 3.2.0版本MySQL Connector连接器配置项介绍：如tables.exclude等

由于 MySQL Connector 采用的 GPLv2 协议与 Flink CDC 项目不兼容，我们无法在 jar 包中提供 MySQL 连接器。MySQL CDC Pipeline 连接器允许从 MySQL 数据库读取快照数据和增量数据，并提供端到端的整库数据同步能力。标识定义几何体的 SRS，

overfit同步小助手 2024-12-12 05:03:44 0 收藏

flink 内存配置（三）：设置JobManager内存

JobManager是Flink集群的控制元素。Flink由3部分组成：资源管理器（Resource Manager）、调度器（Dispatcher）和每个运行的Flink作业对应的JobMaster。注意下面的讲解适用于JobManager 1.11之后的版本。

overfit同步小助手 2024-12-11 14:03:24 0 收藏

【Apache Paimon】-- 4 -- Flink 消费 kafka 数据，然后写入 paimon

注意：此案例以阿里云 OSS 作为 checkpoint 和 apache paimon 的存储介质，存储格式默认为 parquet。// Step 3、若使用 oss 作为 ckp/sep 的存储介质，需要加载 flink checkpoint 全局变量。注意：需要在项目 package 中创建包

overfit同步小助手 2024-12-11 13:03:26 0 收藏

[实战-11] FlinkSql 设置时区对TIMESTAMP和TIMESTAMP_LTZ的影响

设置flink程序运行期间得时区，flink的内置数据类型TIMESTAMP(3)，我们设置水位线都是基于TIMESTAMP(3)类型，当我们flinkSql 查询flink表的时候，因为时区不同 TIMESTAMP 展示给我们的字符串也是不同的。mysql时区是Asia/Shanghai。

overfit同步小助手 2024-12-11 10:03:45 0 收藏

基于 Flink 的车辆超速监测与数据存储的小实战

本项目成功地利用 Flink、Kafka 和 MySQL 构建了一个车辆超速监测与数据存储系统，实现了从 Kafka 读取卡口数据、判断车辆超速并将超速信息写入 MySQL 的完整流程。通过实时处理卡口数据，交通管理部门能够及时获取超速车辆信息，有助于加强交通监管力度，提高道路交通安全水平。然而，在

overfit同步小助手 2024-12-10 22:03:25 0 收藏

Flink SQL 如何关联实时流的历史数据？

在深入探讨如何关联实时流的历史数据之前，我们先简单了解一下 Flink SQL。Flink SQL 是 Flink 提供的一种声明式查询语言，允许用户通过 SQL 语句对流数据进行处理。Flink SQL 的主要优势在于其简洁性和易用性，使得开发者可以快速构建复杂的流处理任务，而无需深入了解底层的流

overfit同步小助手 2024-12-10 06:03:44 0 收藏

Docker中部署flink集群的两种方式

本文将通过 2 种方式在 docker 中部署 flink standalone 集群，集群中共有 4 个节点，分别是 1 个 jobManager 节点和 3 个 taskManager 节点。方式一能快速部署一个 flink 集群，但是使用的是默认配置，不够灵活，方式二使用的是外置配置文件，可以

overfit同步小助手 2024-12-10 05:06:00 0 收藏

Flink中普通API的使用

使用env.fromElements：类型要一致使用env.fromcollections：支持多种collection的具体类型使用env.generateSequence()方法创建基于Sequence的DataStream --已经废弃了使用env.fromSequence()方法创建基于开始

overfit同步小助手 2024-12-10 04:03:23 0 收藏

Flink 常见问题汇总：反压积压，checkpoint报错，窗口计算，作业报错，无产出，流批不一致，调优等。

这可能是由于数据源的数据本身就不均衡，如Talos/Kafka的Topic中某些partition的数据量较大，某些partition的数据量较小，此时除了可以从业务上和数据源上解决该问题，如果不需要维护数据的有序性(同partition的数据是有序的，如果下游继续使用forward、hash等流分

overfit同步小助手 2024-12-10 02:03:54 0 收藏

Cenots上Flink Standalone 集群部署

环境说明Centos7.5flink-1.20.0-bin-scala_2.12.tgzjdk1.8Flink运行依赖Java环境，如果没有Java环境，可自行下载Java后，再进行下面操作一，Flink下载~解压~运行去Flink官网进行下载，Downloads | Apache Flink，点击

overfit同步小助手 2024-12-10 01:03:58 0 收藏

执行flink sql连接clickhouse库

导入IDEA，maven编译即可，生成flink-connector-clickhouse-1.16.0-SNAPSHOT.jar。手把手教学，flink connector打通clickhouse大数据库，通过下发flink sql，来使用ck。flink官方不支持clickhouse连接器，工作

overfit同步小助手 2024-12-09 07:03:43 0 收藏

Flink问题总结

Flink的问题个人总结

overfit同步小助手 2024-12-08 20:03:50 0 收藏

本地环境提交flink on yarn作业

由上分析可知，提交flink job需要flink配置文件、hadoop环境变量，在本地环境下需要在项目中添加 flink-conf.yaml 配置文件，没有配置hadoop环境变量的话，可以自行添加 core-site.xml、hdfs-site.xml、yarn-site.xml 配置文件到项目

overfit同步小助手 2024-12-08 08:03:27 0 收藏

Flink on YARN是如何确定TaskManager个数的

flink on yarn如何确定taskmanager个数

overfit同步小助手 2024-12-07 22:03:36 0 收藏