大数据 Flink - overfit.cn

【大数据面试】Flink面试题附答案

1、背压问题2、Flink是如何支持批流一体的3、Flink任务延迟高，想解决这个问题，你会如何入手4、Flink的监控页面，有了解吗，主要关注那些指标？5、你们之前Flink集群规模有多大？部署方式是什么？你了解哪些部署方式？6、Flink如何做压测和监控7、Flink checkpoint 的相

overfit同步小助手 2024-05-24 10:03:55 0 收藏

使用Flink SQL实时入湖Hudi/Hive

Hudi是一个流式数据湖平台，使用Hudi可以直接打通数据库与数据仓库，Hudi可以连通大数据平台，支持对数据的增删改查。Hudi支持同步数据入库，提供了事务保证、索引优化，是打造实时数仓、实时湖仓一体的新一代技术。下面以我实际工作中遇到的问题，聊下湖仓一体的好处，如有不对，敬请指正。

overfit同步小助手 2024-05-24 08:04:16 0 收藏

阿里巴巴瓴羊基于 Flink 实时计算的优化和实践

本⽂整理⾃阿里云智能集团技术专家王柳焮⽼师在 Flink Forward Asia 2023 中平台建设专场的分享。

overfit同步小助手 2024-05-24 04:03:43 0 收藏

Flink WordCount实践

overfit同步小助手 2024-05-24 02:03:59 0 收藏

云粒智慧实时数仓的架构演进分享：OceanBase + Flink CDC

4月20日，在2024 OceanBase开发者大会上，云粒智慧的高级技术专家付大伟，分享了云粒智慧实时数仓的构建历程。他讲述了如何在传统数仓技术框架下的相关努力后，选择了OceanBase + Flink CDC架构的实时数仓演进历程。

overfit同步小助手 2024-05-24 00:04:32 0 收藏

Flink CDC 整库 / 多表同步至 Kafka 方案（附源码）

我们此前介绍的一些 CDC 开箱即用方案往往都是一张表对应一条独立的链路（作业），需要一个独立的数据库连接，在表数量很大的情况下，会对数据库造成很大压力，同时过多的 Flink 作业会不易于管理和维护，为众多小表创建独立的采集作业也浪费了资源。此外，使用 Flink SQL 针对每张表定义 CDC

overfit同步小助手 2024-05-23 22:04:44 0 收藏

海豚调度系列之：任务类型——Flink节点

本案例为大数据生态中常见的入门案例，常应用于 MapReduce、Flink、Spark 等计算框架。主要为统计输入的文本中，相同的单词的数量有多少。若生产环境中要是使用到 flink 任务类型，则需要先配置好所需的环境。在使用 Flink 任务节点时，需要利用资源中心上传执行程序的 jar 包。F

overfit同步小助手 2024-05-23 22:04:41 0 收藏

Flink窗口理论到实践 | 大数据技术

⭐⭐个人主页🔎哆啦A梦撩代码🎉欢迎关注🔎👍⭐️留言📝

overfit同步小助手 2024-05-23 22:04:34 0 收藏

Seal^_^【送书活动第2期】——《Flink入门与实战》

overfit同步小助手 2024-05-23 21:04:21 0 收藏

FlinkCDC系列之Oracle实时数据采集

新增一条数据：INSERT INTO "FLINKUSER"."ORDERS"("ORDER_ID", "ORDER_DATE", "CUSTOMER_NAME", "PRICE", "PRODUCT_ID", "ORDER_STATUS") VALUES ('10006', TO_TIMESTAM

overfit同步小助手 2024-04-11 10:03:53 0 收藏

Flink 架构深度解析

它通过高效的事件处理模型、强大的状态管理和灵活的部署选项，为实时数据分析提供了一个可靠和高效的平台。- **作业调度**：接收提交的作业，将作业的 JobGraph 转换为 ExecutionGraph，并调度任务到 TaskManager 上执行。- **高吞吐量和低延迟**：Flink 的事件驱

overfit同步小助手 2024-04-11 03:03:28 0 收藏

Flink窗口函数

看过上面3个案例，可以发现增量聚合函数ReduceFunction和AggregateFunction都是数据来一条处理一条，而全窗口函数ProcessWindowFunction则是在窗口结束的时候才执行计算，因此process的效率相对更低。但是process的优点在于它可以得到上下文信息，因此

overfit同步小助手 2024-04-10 08:03:44 0 收藏

flink的自动类型推导：解决udf的通用类型问题

使用flink的自动类型推导解决udf的通用类型问题

overfit同步小助手 2024-04-09 23:03:44 0 收藏

SpringBoot集成Flink-CDC，实现对数据库数据的监听

SpringBoot 集成 Flink CDC 实现对数据库表中数据变动的监听，源码中实现简易版增量迁移。

overfit同步小助手 2024-04-09 14:03:54 0 收藏

Flink 内存梳理与遇到的问题修复

flink

overfit同步小助手 2024-04-09 02:03:50 0 收藏

【Flink SQL】Flink SQL 基础概念（一）：SQL & Table 运行环境、基本概念及常用 API

Table API 是一种集成在 Java、Scala 和 Python 语言中的查询 API，简单理解就是用 Java、Scala、Python 按照 SQL 的查询接口封装了一层 lambda 表达式的查询 API，它允许以强类型接口的方式组合各种关系运算符（如选择、筛选和联接）的查询操作，然后

overfit同步小助手 2024-04-08 07:03:48 0 收藏

Spark+Flink+Kafka环境配置

overfit同步小助手 2024-04-08 06:03:42 0 收藏

java Flink（四十二）Flink的序列化以及TypeInformation介绍（源码分析）

主要作用是为了在 Flink系统内有效地对数据结构类型进行管理，能够在分布式计算过程中对数据的类型进行管理和推断。同时基于对数据的类型信息管理，Flink内部对数据存储也进行了相应的性能优化。每一个具体的数据类型都对应一个TypeInformation的具体实现，每一个TypeInformation

overfit同步小助手 2024-04-07 19:03:45 0 收藏

Flink CDC实践

访问http://虚拟机ip:8081，查看flink webUI是否正常访问。下载flink安装包，网速较慢，可以尝试在国内镜像网址。将mysql和doris的驱动包移动到lib目录下。启动flink，查看启动是否成功。解压flink-cdc安装包。配置flink环境变量。下载flink安装包。解

overfit同步小助手 2024-04-07 11:03:41 0 收藏

[flink 实时流基础]源算子和转换算子

所以，source就是我们整个处理程序的输入端。filter转换操作，顾名思义是对数据流执行一个过滤，通过一个布尔条件表达式设置过滤条件，对于每一个流内元素进行判断，若为true则元素正常输出，若为false则元素被过滤掉。flatMap可以认为是“扁平化”（flatten）和“映射”（map）两步

overfit同步小助手 2024-04-06 22:03:35 0 收藏