大数据 Flink - overfit.cn

Flink流批一体计算（14）：PyFlink Tabel API之SQL查询

create_temporary_view(view_path, table) 将一个 `Table` 对象注册为一张临时表，类似于 SQL 的临时表。sql_query(query) 执行一条 SQL 查询，并将查询的结果作为一个 `Table` 对象。Table API 中的 Table

overfit同步小助手 2023-08-25 00:04:05 0 收藏

flink任务性能优化

明确指出，当前内存有限的情况下，使用rocketDB会造成性能损害，因为rocketDB会不停刷内存，造成高io和高cpu。所以在小型化项目时，对状态数据要求不高时，可考虑不使用rocketDB作为状态后端。2、将下游数据需要的数据以参数的形式向下传递。1、使用异步算子，异步执行操作。

overfit同步小助手 2023-08-24 20:03:53 0 收藏

【大数据】Flink 详解（四）：核心篇 Ⅲ

Checkpoint 被叫做检查点，是 Flink 实现容错机制最核心的功能，是 Flink 可靠性的基石，它能够根据配置周期性地基于 Stream 中各个 Operator 的状态来生成 Snapshot 快照，从而将这些状态数据定期持久化存储下来，当 Flink 程序一旦意外崩溃时，重新运行程序

overfit同步小助手 2023-08-24 10:04:24 0 收藏

大数据Flink（五十四）：Flink用武之地

应用较多的如风控系统，当风控系统需要处理各种各样复杂的规则时，Data Driven 就会把处理的规则和逻辑写入到Datastream 的API 或者是ProcessFunction 的API 中，然后将逻辑抽象到整个Flink 引擎，当外面的数据流或者是事件进入就会触发相应的规则，这就是Data

overfit同步小助手 2023-08-24 09:04:35 0 收藏

大数据Flink（五十八）：Flink on Yarn的三种部署方式介绍

这种模式会预先在yarn或者或者k8s上启动一个flink集群，然后将任务提交到这个集群上，这种模式，集群中的任务使用相同的资源，如果某一个任务出现了问题导致整个集群挂掉，那就得重启集群中的所有任务，这样就会给集群造成很大的负面影响。通过以上两种模式的特点描述，可以看出，main方法都是在客户端执行

overfit同步小助手 2023-08-24 09:04:15 0 收藏

flink to starrocks 问题集锦....

报如图所示：提示所示：超出内存限制，生产上不知道BE设置了多少。

overfit同步小助手 2023-08-24 03:03:51 0 收藏

大数据Flink（六十四）：Flink运行时架构介绍

TaskManager 启动之后，JobManager 会与它建立连接，并将作业图（JobGraph）转换成可执行的“执行图”（ExecutionGraph）分发给可用的 TaskManager，然后就由 TaskManager 具体执行任务。从以 Greenplum 为代表的 MPP（Massiv

overfit同步小助手 2023-08-23 23:04:17 0 收藏

美团买菜基于 Flink 的实时数仓建设

overfit同步小助手 2023-08-23 22:04:36 0 收藏

【大数据】Flink 详解（一）：基础篇

Flink 是一个以流为核心的高可用、高性能的分布式计算引擎。具备流批一体，高吞吐、低延迟，容错能力，大规模复杂计算等特点，在数据流上提供数据分发、通信等功能。

overfit同步小助手 2023-08-23 08:04:20 0 收藏

flink cdc数据同步，DataStream方式和SQL方式的简单使用

flink cdc能感知数据库的所有修改、新增、删除操作，并以流的形式，进行实时的触发和反馈。

overfit同步小助手 2023-08-23 03:04:19 0 收藏

2.Flink应用

2.1 数据流DataStream：DataStream是Flink数据流的核心抽象，其上定义了对数据流的一系列操作 DataStreamSource：DataStreamSource 是 DataStream 的起点， DataStreamSource 在StreamExecutionEnv

overfit同步小助手 2023-08-23 00:04:22 0 收藏

使用flink的sql-client.sh，测试mysql--＞kafka--＞kafka--＞mysql实时流

使用flink的sql-client测试数据流程mysql-->kafka-->kafka-->mysql

overfit同步小助手 2023-08-22 05:04:14 0 收藏

大数据Flink（五十一）：Flink的引入和Flink的简介

随着第三代计算引擎的出现，促进了上层应用快速发展，例如各种迭代计算的性能以及对流计算和 SQL 等的支持。对于上层应用来说，就不得不想方设法去拆分算法，甚至于不得不在上层应用实现多个 Job 的串联，以完成一个完整的算法，例如迭代计算。在德语中，Flink一词表示快速和灵巧，项目采用松鼠的彩色图案作

overfit同步小助手 2023-08-22 03:03:58 0 收藏

Flink 归约聚合（reduce）

其实，reduce 的语义是针对列表进行规约操作，运算规则由 ReduceFunction 中的 reduce方法来定义，而在 ReduceFunction 内部会维护一个初始值为空的累加器，注意累加器的类型。将合并的结果看作一个数据、再跟后面的数据合并，最终会将它“简化”成唯一的一个数据，这也就是

overfit同步小助手 2023-08-21 23:04:46 0 收藏

深入理解Flink IntervalJoin源码

接着会经历嵌套for循环，判断哪些StreamRecord是满足Join条件的：以当前StreamRecord的Timestamp和指定的上、下界组成时间过滤条件，对当前StreamRecord的“对方MapState”内的每个Timestamp（作为Key）进行比对。接着将当前StreamReco

overfit同步小助手 2023-08-21 18:04:06 0 收藏

[Flink] Flink On Yarn（yarn-session.sh）启动错误

在Flink上启动 yarn-session.sh时出现 The number of requested virtual cores for application master 1 exceeds the maximum number of virtual cores 0 available in

overfit同步小助手 2023-08-21 06:04:18 0 收藏

大数据-玩转数据-FLINK-从kafka消费数据

运行本段代码，等待kafka产生数据进行消费。

overfit同步小助手 2023-08-20 23:04:34 0 收藏

使用java写一个对接flink的例子

方法生成 1000 个从 0 到 999 的数字作为模拟数据，将它们转化为字符串并拼接成键值对，然后使用 Flink 的 Kafka 生产者将数据写入到 Kafka 的。方法开启了检查点，并设置了检查点间隔和模式。它使用了 Flink 的 Kafka 消费者从 Kafka 主题。中读取数据，然后将每

overfit同步小助手 2023-08-20 09:04:27 0 收藏

Flink CDC 详解

Flink CDC介绍

overfit同步小助手 2023-08-20 05:04:03 0 收藏

Flink Metrics监控 pushgateway搭建

overfit同步小助手 2023-08-19 19:04:33 0 收藏