大数据 Flink - overfit.cn

Flink从Kafka读取数据流写入到MySQL

今天来实现一个综合案例：Flink从独立部署的Kafka读取数据流，处理后，通过自定义的Sink函数写入到MySQL中部署一个Kafka服务，源源不断的想主题kafka发送数据参考：SpringBoot整合Kafka效果Flink思路：从Kafka源源不断获取的数据为User实体的JSON字符串，需

overfit同步小助手 2023-03-29 08:05:25 0 收藏

flinkcdc抽取oracle数据（oracle cdc详细文档）

flinkcdc集成说明文档、oraclecdc详细文档、全量+增量同步oracle数据

overfit同步小助手 2023-03-29 08:05:00 0 收藏

flink任务提交,查询,停止工具

因项目，需要在spring boot后台项目中集成flink任务提交，查询之类的功能，所有有了这个项目这个项目，可以通过java api的形式，帮助你提交，查询，暂停flink任务，也可以构建和关闭flink yarn session集群。主要通过restful接口和构建jobGraph实现。

overfit同步小助手 2023-03-29 07:05:16 0 收藏

Flink Sql(二) Kafka连接器

如果作为TableSource，连接器会将读取到的topic中的数据（key,value），解释为对当前key的数据值的更新（UPDATE），也就是查找动态表中key对应的一行数据，将value更新为最新的值；需要特别说明的是，在KafkaTable的字段中有一个ts，它的声明中用到了METADAT

overfit同步小助手 2023-03-29 07:04:57 0 收藏

Flink的Checkpoint

最近面试问的最多的就是Flink如何进行容错的，总结一下关于checkpoint的知识点

overfit同步小助手 2023-03-29 07:04:45 0 收藏

第四章 Flink 窗口和水位线

在流式处理的过程中，数据是在不同的节点间不停流动的；这样一来，就会有网络传输的延迟，当上下游任务需要跨节点传输数据时，它们对于“时间”的理解也会有所不同。当基于特定时间段(通常称为Windows，窗口)，或者当执行事件处理时，事件的时间发生很重要。

overfit同步小助手 2023-03-29 06:05:05 0 收藏

iceberg-flink 八：累积窗口使用。（CUMULATE）

CUMULATE flink iceberg

overfit同步小助手 2023-03-29 05:04:50 0 收藏

Flink CDC详细教程（介绍、原理、代码样例）

CDC 是变更数据捕获（Change Data Capture）技术的缩写，它可以将源数据库（Source）的增量变动记录，同步到一个或多个数据目的（Sink）。在同步过程中，还可以对数据进行一定的处理，例如分组（GROUP BY）、多表的关联（JOIN）等。例如对于电商平台，用户的订单会实时写入到

overfit同步小助手 2023-03-29 04:04:51 0 收藏

Flink -- 内置函数(ALL)

目录比较函数1.比较函数比较函数的函数名和功能描述如下：函数名功能描述函数名功能描述 value1 = value2 比较 value1 和 value2 是否相等，如果相等则返回 TRUE，如果不相等则返回 FALSE。

overfit同步小助手 2023-03-29 04:04:13 0 收藏

Flink配置Yarn日志聚合、配置历史日志。

yarn容器退出之后，默认是不保存日志的。所以需要开启JobHistoryServer. 无论Flink还是Spark都支持自建集群(standalone cluster)。但是为了保证稳定性和资源隔离等，生产环境里的任务最好借助资源管理框架(如Yarn)运行。任务运行在yarn上，查询日志就可能不

overfit同步小助手 2023-03-29 03:05:15 0 收藏

Flink日志文件配置

因为在正常的情况下，Flink的流数据是非常大的，有时候会使用print()打印数据自己查看，有时候为了查找问题会开启debug日志，就会导致日志文件非常大，通过Web UI查看对应的日志文件是会非常卡，所以首先将日志文件按照大小滚动生成文件，我们在查看时不会因为某个文件非常大导致Web UI界面卡

overfit同步小助手 2023-03-29 03:04:53 0 收藏

【Flink系列】窗口系列简介

overfit同步小助手 2023-03-29 01:04:49 0 收藏

【Flink】解析参数之ParameterTool

在我们平时写程序的时候，会把很多参数提出来在命令行输入或者配置文件中读取，Flink源码中提供了解析多数据源（命令行、配置文件）的解析类ParameterTool，我们常用的就是命令行、配置文件这两种方式，省去我们自己写解析的逻辑，下面我们看下怎么使用ParameterTool

overfit同步小助手 2023-03-29 01:04:23 0 收藏

flink中的时间属性

1：时间的几种类型（官网概念）1.1处理时间指的是执行具体操作时的机器时间（大家熟知的绝对时间, 例如 Java的 System.currentTimeMillis()) ）1.2事件事件指的是执行具体操作时的机器时间（大家熟知的绝对时间, 例如 Java的 System.currentTimeMi

overfit同步小助手 2023-03-28 23:05:38 0 收藏

用flink cdc sqlserver 将数据实时同步到clickhouse

flink cdc 终于支持 sqlserver 了。现在互联网公司用sqlserver的不多，大部分都是一些国企的老旧系统。我们以前同步数据，都是用datax，但是不能实时同步数据。现在有了flinkcdc，可以实现实时同步了。1、首先sqlserver版本：要求sqlserver版本为14及以上

overfit同步小助手 2023-03-28 23:05:21 0 收藏

StarRocks官网摘要笔记

StarRocks 官网摘要笔记

overfit同步小助手 2023-03-28 23:05:02 0 收藏

Flink窗口及其分类-详细说明

Flink 是一种流式计算引擎，主要是来处理无界数据流的，数据源源不断、无穷无尽。想要更加方便高效地处理无界流，一种方式就是将无限数据切割成有限的“数据块”进行处理，这就是所谓的“窗口”（Window）。所以在 Flink 中，窗口其实并不是一个“框”，流进来的数据被框住了就只能进这一个窗口。相比之

overfit同步小助手 2023-03-28 23:04:53 0 收藏

Flink CDC-2.3版本概述

overfit同步小助手 2023-03-28 22:05:10 0 收藏

Flink学习19：算子介绍keyBy

主要作用：把相同的数据，汇总到相同的分区中。

overfit同步小助手 2023-03-28 21:05:59 0 收藏

FusionInsight MRS Flink DataStream API读写Hudi实践

目前Hudi只支持FlinkSQL进行数据读写，但是在实际项目开发中一些客户存在使用Flink DataStream API读写Hudi的诉求。1.HoodiePipeline.java 将Hudi内核读写接口进行封装，提供Hudi DataStream API。1）HoodiePipeline.j

overfit同步小助手 2023-03-28 21:05:50 0 收藏