大数据 Flink - overfit.cn

Flink 中 JDBC Connector 使用详解

Flink JDBC Connector 是一个简单而高效的工具，适用于实时计算场景下与关系型数据库的交互。无论是数据写入还是读取，都可以通过简单配置快速实现。在实时计算或离线任务中，往往需要与关系型数据库交互，例如 MySQL、PostgreSQL 等。本文将介绍 Flink JDBC Conne

overfit同步小助手 2024-12-07 21:03:47 0 收藏

Flink DataStream的使用 - 对数据的读取、使用、输出的操作

overfit同步小助手 2024-12-07 09:03:48 0 收藏

[实时计算flink]数据摄入YAML作业快速入门

实时计算Flink版基于Flink CDC，通过开发YAML作业的方式有效地实现了将数据从源端同步到目标端的数据摄入工作。本文介绍如何快速构建一个YAML作业将MySQL库中的所有数据同步到StarRocks中。已创建Flink工作空间，详情请参见。上下游存储已创建RDS MySQL实例，详情请参见

overfit同步小助手 2024-12-06 16:04:34 0 收藏

Flink常见面试题

基于本地集合的source（Collection-based-source）基于文件的source（File-based-source）基于网络套接字（socketTextStream）SourceFunction:非并行数据源(并行度只能=1) --接口RichSourceFunction:多功能

overfit同步小助手 2024-12-05 19:03:49 0 收藏

如何配置 Flink CDC 连接 OceanBase 实现数据实时同步

Flink CDC 为我们提供了一种高效、可靠的数据同步解决方案，结合 OceanBase 的高性能数据库特性，可以满足各种实时数据处理场景的需求。在实际应用中，还可以根据具体情况进行更多的优化和扩展，如调整并行度、设置数据过滤规则等，以提高数据同步的性能和效率

overfit同步小助手 2024-12-05 14:03:41 0 收藏

Flink和Spark的区别是什么？各自的应用场景是什么？

FlinkFlink 是一个分布式流处理框架，其架构基于流计算，将一切都看作是流。它采用了一种基于事件驱动的架构，数据以流的形式源源不断地进入系统，并且能够实时处理这些数据。例如，在实时监控网络流量的场景中，网络流量数据作为一个持续的数据流进入 Flink 系统，Flink 可以对每一个数据包（事件

overfit同步小助手 2024-12-05 11:04:29 0 收藏

flink sql同步mysql数据表到mysql

访问 192.168.207.193:8081 （默认是8081端口可在配置文件里修改）数据库先创建一个库,在库里创建表再添加数据。圈起来的部分为后面数据库登陆的初始密码。进入flink的lib目录上传三个依赖。执行从源表插入结果表操作，生成同步作业。原本是localhost修改为ip。查看是否同

overfit同步小助手 2024-12-04 23:03:25 0 收藏

再谈Java类型擦除与其对Flink类型和序列化的影响

前言本文前半部分的内容在很久之前讲过，但是最近又有交接到团队内的历史任务出现这方面导致的性能问题，故有必要再讲一次，并扩展一部分新内容。先通过两个例子来引入Java类型擦除。Java类型擦除的表现例一这段代码无法通过编译，提示两个方法签名冲突，因为擦除类型相同。如果去掉其中一个方法，反编译之后的代码

overfit同步小助手 2024-12-04 13:03:47 0 收藏

Flink介绍

Apache Flink 是一个开源的流处理框架，用于处理。它具有高吞吐量、低延迟和容错性强的特点，适用于各种实时数据处理场景，如实时分析、事件驱动应用和数据管道等。Flink 提供了丰富的 API，支持 Java、Scala 和 Python 等编程语言，并且可以与 Hadoop、Kafka 等大

overfit同步小助手 2024-12-04 05:03:43 0 收藏

使用flink编写WordCount

1. env-准备环境2. source-加载数据转换4. sink-数据输出5. execute-执行。

overfit同步小助手 2024-12-04 01:03:49 0 收藏

Flink实战之基于Flink SQL 实现长周期数据去重: 分层去重方案介绍

在大数据处理中，如何高效去重数据，尤其是面对长周期流数据时，是一个值得深入探讨的问题。Flink SQL 作为流处理的强大工具，提供了灵活的查询和变换能力，尤其是在数据去重场景中，可以采用分层去重方案以提高性能和准确性。本文将通过一段基于 Flink SQL 的去重实现代码，详细介绍如何设计并实现一

overfit同步小助手 2024-12-04 01:03:41 0 收藏

Flink Python作业快速入门

本文带您快速体验Flink Python流作业和批作业的创建、部署和启动，以了解实时计算Flink版Python作业的操作流程。

overfit同步小助手 2024-12-03 18:03:40 0 收藏

【问题解决】Flink在linux上运行成功但是无法访问webUI界面

在搭建Flink的时候，已经在linux服务器上运行了./start-cluster.sh，而且日志显示已经成功了。正常来说应该能通过ip:8081来访问(8081是Flink WebUI的默认端口)，但是访问的时候，显示访问拒绝。然后就可以通过ip:8081端口（可以在上面修改rest.port

overfit同步小助手 2024-12-03 16:03:49 0 收藏

Flink本地模式安装详解

本文开头对flink的几种安装模式都做了介绍，并且详细的介绍了我们开发的时候会使用到的本地模式的安装启动停止过程，并且用了一个demo验证集群是否可用，本地模式是比较方便轻量的安装模式，便于我们开发调试使用。

overfit同步小助手 2024-12-03 10:03:59 0 收藏

Flink CDC（SQL Client）连接 MySQL 数据库教程

这篇文章将指导如何使用 Flink CDC 连接到 MySQL 数据库，并捕获数据变更。

overfit同步小助手 2024-12-03 10:03:23 0 收藏

深入Flink StreamGraph：构建流处理拓扑的奥秘

表示流式处理拓扑的类，它包含构建执行任务图所需的所有信息。说白了就是我们写的代码直接生成的图，表示程序的拓扑结构StreamGraph类图，可以看到这个类里面包含了执行任务所需的所有信息，比如状态后端，JobType(流or批)、checkpoint配置等等，我们今天从宏观层面看，不深入每个细节，先

overfit同步小助手 2024-12-02 15:03:42 0 收藏

Flink中的Savepoints和Checkpoints有什么区别？

触发方式Checkpoints 是自动触发的，用户可以配置触发频率。Savepoints 是手动触发的，用户根据需要决定何时创建 Savepoint。用途Checkpoints 用于实现应用程序的容错，确保在发生故障时可以从最近的检查点恢复状态。Savepoints 用于应用程序的版本迁移和状态转移

overfit同步小助手 2024-12-02 01:03:39 0 收藏

Flink时间语义和时间窗口

在实际的流计算业务场景中，我们会发现，数据和数据的计算往往都和时间具有相关性。归纳总结可以发现，这些和时间相关的数据计算可以统一用一个计算模型来描述：每隔一段时间，计算过去一段时间内的数据，并输出结果。这个计算模型，就是时间窗口。

overfit同步小助手 2024-12-01 07:03:37 0 收藏

【Flink-scala】DataStream编程模型之窗口的划分-时间概念-窗口计算程序

窗口划分，时间概念及窗口计算函数程序

overfit同步小助手 2024-12-01 03:03:52 0 收藏

Flink-Source的使用

基于本地集合的source（Collection-based-source）基于文件的source（File-based-source）基于网络套接字（socketTextStream）在flink最常见的创建DataStream方式有四种：l 使用env.fromElements()，这种方式也支

overfit同步小助手 2024-11-30 09:03:41 0 收藏