大数据 Flink - overfit.cn

Flink 读写MySQL数据（DataStream和Table API）

Flink提供了基于JDBC的方式，可以将读取到的数据写入到MySQL中；本文通过两种方式将数据下入到MySQL数据库，其他的基于JDBC的数据库类似，另外，Table API方式的Catalog指定为Hive Catalog方式，持久化DDL操作。Maven依赖，包含了Hive Catalog的相

overfit同步小助手 2023-03-23 20:05:18 0 收藏

【UML】UML建模

用例图参与者、用例的基本概念。1.2 用例描述的格式要求。1.3 绘制用例图。2 类图和对象图2.1 类图的基本概念。2.2 分析识别类，绘制类图。2.3 绘制对象图。3 顺序图3.1 顺序图的组成。3.2 顺序图中的消息类型。3.3 绘制顺序图。4 状态图4.1 状态机的含义。4.2 状态机图中的

overfit同步小助手 2023-03-23 20:05:02 0 收藏

flink任务内存调优，TaskManager、JobManager内存配置

Flink是基于java的JVM运行，拥有高效的数据处理能力，但是考虑到用户在 Flink 上运行的应用的多样性，尽管flink框架已经为所有配置项提供合理的默认值，仍无法满足所有情况下的需求。 flink进程总内存、taskmanager内存、jobmanager内存配置...

overfit同步小助手 2023-03-23 19:05:18 0 收藏

Flink二阶段提交

XA（eXtended Architecture）是指由X/Open 组织提出的分布式交易处理的规范。XA 是一个分布式事务协议，由Tuxedo 提出，所以分布式事务也称为XA 事务。XA 协议主要定义了事务管理器TM（Transaction Manager，协调者）和资源管理器RM（Resourc

overfit同步小助手 2023-03-23 19:04:50 0 收藏

PyFlink使用说明：建表及连接Mysql数据库

PyFlink版本是1.16.0，所以需要下载：flink-connector-jdbc-1.16.0.jar。环境根据最新的版本安装即可，需要注意最新的PyFlink支持的最大Python版本。注意点：使用批处理环境的时候，无法执行成功，必须使用流处理环境。注意点：使用批处理环境的时候，

overfit同步小助手 2023-03-23 18:05:34 0 收藏

大数据Flink进阶（三）：Flink核心特性

另外，Flink通过序列化/反序列化方法将所有的数据对象转换成二进制在内存中存储，降低数据存储的大小的同时，能够更加有效地对内存空间进行利用，降低GC带来的性能下降或任务异常的风险，因此Flink较其他分布式处理的框架会显得更加稳定，不会因为JVM GC等问题而影响整个应用的运行。在流处理应用中，数

overfit同步小助手 2023-03-22 08:04:10 0 收藏

大数据Flink进阶（六）：Flink入门案例

DataSet和DataStream是Flink中表示数据的特殊类，DataSet处理的数据是有界的，DataStream处理的数据是无界的，这两个类都是不可变的，一旦创建出来就无法添加或者删除数据元。主要是因为在Flink1.15版本后，Flink添加对opting-out（排除）Scala的支持

overfit同步小助手 2023-03-21 12:03:36 0 收藏

大数据Flink进阶（四）：Flink应用场景以及其他实时计算框架对比

在实际生产的过程中，大量数据在不断地产生，例如金融交易数据、互联网订单数据、GPS定位数据、传感器信号、移动终端产生的数据、通信信号数据等，以及我们熟悉的网络流量监控、服务器产生的日志数据，这些数据最大的共同点就是实时从不同的数据源中产生，然后再传输到下游的分析系统。另一方面结合实时数据ETL处理

overfit同步小助手 2023-03-18 13:04:04 0 收藏

大数据flink框架入门分享(起源与发展、实时与离线计算、场景、处理流程、相关概念、特性普及、入门Demo)

起源于一个叫作 Stratosphere 的项目，它是由 3 所地处柏林的大学和欧洲其他一些大学在 2010~2014 年共同进行的研究项目，由柏林理工大学的教授沃克尔·马尔科（Volker Markl）领衔开发。2014 年 4 月，Stratosphere 的代码被复制并

overfit同步小助手 2023-03-07 18:04:25 0 收藏

为什么说新一代流处理器Flink是第三代流处理器(论点:发展历史、区别、适用场景)

Flink 被认为是第三代流处理器，这是因为 Flink 在设计时参考了前两代流处理器的经验教训并引入了一些新的技术和思想，从而使得 Flink 具有更高的性能和更广泛的应用场景。下面我带大家了解一下流处理器从第一代到第三代的发展历史。对于有状态的流处理，当数据越来越多时，我们必须用分布式的集群架构

overfit同步小助手 2023-03-04 08:03:44 0 收藏

flink学习33：flinkSQL连接mysql，查询插入数据

1.生成运行时env2.生成表环境3.接上数据流，数据流数据生成表4.把数据库中sink保存数据的表，在flink中生成一遍（相当于把flink生成的表，绑定到数据库中的表），配上数据库连接信息，并执行，及注册5.查询表，可以根据注册表名查询6.插入表，可以根据生成的flink表进行数据插入。

overfit同步小助手 2023-02-17 00:04:17 0 收藏

【Flink】面试题精简版（持续更新）

作为大数据领域炙手可热的大数据组件，flink作为大数据行业跳槽必问的组件，整理一些Flink相关的面试题供大家参考，有些题言简意赅即可，大多数的博客冗余一堆的知识点，看完要好久，我想帮大家提炼总结出核心的点，以帮助大家临阵磨枪，短时间掌握，当你把知识提炼出来，你会发现你的知识进步了，当你把简单提炼

overfit同步小助手 2023-02-15 10:04:10 0 收藏

【Flink基础】-- Flink CDC介绍

一、Flink CDC 是什么？ 2020年 Flink cdc 首次在 Flink forward 大会上官宣，由Jark Wu & Qingsheng Ren 两位大佬介绍，原始 blog 点击链接。 Flink CDC connector 可以捕获在一个或多个表中发生的所有变更。

overfit同步小助手 2023-02-10 16:04:42 0 收藏

Flink cdc 介绍及使用 FlinkCDC读取mysql 及 jdbc 连接参数配置

Flink cdc 介绍常见cdc开源方案Flink cdc 使用案例Flink cdc读取mysql 及 jdbc 连接参数配置1.Maven POM 文件2.Flink CDC 代码补充CDC 的全称是 Change Data Capture ，在广义的概念上，只要是能捕获数据变更的技术，我们都

overfit同步小助手 2023-02-10 03:03:56 0 收藏

flink cdc笔记（一）：flink cdc简介

flink cdc

overfit同步小助手 2023-01-25 02:04:11 0 收藏

Flink SQL通过Hudi HMS Catalog读写Hudi并同步Hive表（强烈推荐这种方式）

上篇文章Flink SQL操作Hudi并同步Hive使用总结总结了如何使用Flink SQL读写Hudi并同步Hive，介绍了创建表的各种方式，但是每一种方式都不太完美。本文介绍一种比较完美的方式，通过Hudi HMS Catalog读写Hudi并同步Hive表，这里的Hudi HMS Catalo

overfit同步小助手 2023-01-24 12:04:57 0 收藏

Flink SQL增量查询Hudi表

前面总结了Spark SQL增量查询Hudi表和Hive增量查询Hudi表。最近项目上也有Flink SQL增量查询Hudi表的需求，正好学习总结一下。地址：https://hudi.apache.org/cn/docs/querying_data#incremental-query用show_co

overfit同步小助手 2022-12-11 07:58:40 0 收藏

Flink SQL通过Hudi HMS Catalog读写Hudi并同步Hive表（强烈推荐这种方式）

上篇文章Flink SQL操作Hudi并同步Hive使用总结总结了如何使用Flink SQL读写Hudi并同步Hive，介绍了创建表的各种方式，但是每一种方式都不太完美。本文介绍一种比较完美的方式，通过Hudi HMS Catalog读写Hudi并同步Hive表，这里的Hudi HMS Catalo

overfit同步小助手 2022-11-04 07:20:38 0 收藏

想了解流计算？你必须得看一眼，实现Flink on Yarn的三种部署方式，并运行wordcount计算任务

想了解流计算，你必须得看一眼，实现Flink on Yarn的三种部署方式，并运行wordcount,7000字奉上

overfit同步小助手 2022-10-24 07:22:32 0 收藏

Flink / Scala 实战 - 18.一套代码搞懂 KeyedState

Flink - ValueState 、ListState 、 ReducingState 、AggregateState、MapState 实战 demo。

overfit同步小助手 2022-10-23 07:22:29 0 收藏

Flink 读写MySQL数据（DataStream和Table API）

【UML】UML建模

flink任务内存调优，TaskManager、JobManager内存配置

Flink二阶段提交

PyFlink使用说明：建表及连接Mysql数据库

大数据Flink进阶（三）：Flink核心特性

大数据Flink进阶（六）：Flink入门案例

大数据Flink进阶（四）：Flink应用场景以及其他实时计算框架对比

大数据flink框架入门分享(起源与发展、实时与离线计算、场景、处理流程、相关概念、特性普及、入门Demo)

为什么说新一代流处理器Flink是第三代流处理器(论点:发展历史、区别、适用场景)

flink学习33：flinkSQL连接mysql，查询插入数据

【Flink】面试题精简版（持续更新）

【Flink基础】-- Flink CDC介绍

Flink cdc 介绍及使用 FlinkCDC读取mysql 及 jdbc 连接参数配置

flink cdc笔记（一）：flink cdc简介

Flink SQL通过Hudi HMS Catalog读写Hudi并同步Hive表（强烈推荐这种方式）

Flink SQL增量查询Hudi表

Flink SQL通过Hudi HMS Catalog读写Hudi并同步Hive表（强烈推荐这种方式）

想了解流计算？你必须得看一眼，实现Flink on Yarn的三种部署方式，并运行wordcount计算任务

Flink / Scala 实战 - 18.一套代码搞懂 KeyedState

作者榜

资讯小助手

内容小助手

Deephub

奕凯