Flink - overfit.cn

4.3、Flink任务怎样读取Kafka中的数据

flink1.17 读取kafka 数据

overfit同步小助手 2023-08-31 15:03:46 0 收藏

【大数据】Flink 详解（五）：核心篇 Ⅳ

反压（backpressure）是实时计算应用开发中，特别是流式计算中，十分常见的问题。反压意味着数据管道中某个节点成为瓶颈，下游处理速率跟不上上游发送数据的速率，而需要对上游进行限速。由于实时计算应用通常使用消息队列来进行生产端和消费端的解耦，消费端数据源是 pull-based 的，所以反压通常

overfit同步小助手 2023-08-30 14:05:54 0 收藏

flink消费kafka数据，按照指定时间开始消费

kafka中根据时间戳开始消费数据。

overfit同步小助手 2023-08-30 05:04:07 0 收藏

Flink 数据集成服务在小红书的降本增效实践

实时引擎研发工程师袁奎，在 Flink Forward Asia 2022 数据集成专场的分享。

overfit同步小助手 2023-08-30 01:04:09 0 收藏

flink cdc环境搭建

overfit同步小助手 2023-08-29 23:04:08 0 收藏

Flink 检查点配置

当有界数据 , 部分Task 完成 , Flink 1.14 后 , 它们依然能进行检查点。检查点存储 (CheckpointStorage) : 持久化存储位置。Rocksdb 状态后端 : 启用增量 checkpoint。

overfit同步小助手 2023-08-29 18:04:34 0 收藏

Flink 火焰图

Flink 作业动态参数里增加配置：“rest.flamegraph.enabled”: “true” 并重启作业。当前该功能没有默认开启，因为这个功能使用时对性能有少量损耗，特别是对于并行度比较大的作业。第五步在 Flink WebUI JM/TM 的 Log List 页面中找到火焰图文件并下

overfit同步小助手 2023-08-29 16:04:25 0 收藏

大数据Flink（六十一）：Flink流处理程序流程和项目准备

下进行安装，这时候我们自动就是启动的PlaygroundEnv环境，在安装的过程中你也可以看到。我们可以手工安装PyFlink，直接在PyCharm的。有了这些信息我们就可以进行PyFlink的作业开发了。本地环境安装的Python3.8版本。先利用PyCharm创建项目，名为。创建之后，我们会看到

overfit同步小助手 2023-08-28 21:04:00 0 收藏

4.2、Flink任务怎样读取文件中的数据

读取文件时可以设置哪些规则呢？1. 文件的格式(txt、csv、二进制...)2. 文件的分隔符(按\n 分割)3. 是否需要监控文件变化(一次读取、持续读取)基于以上规则，Flink为我们提供了非常灵活的读取文件的方法。

overfit同步小助手 2023-08-27 16:04:22 0 收藏

flink的ProcessWindowFunction函数的三种状态

context.getWindowState ，context.getGlobalState ， getRuntimeContext.getState三种的关系

overfit同步小助手 2023-08-27 06:04:21 0 收藏

基于 Flink SQL CDC 数据处理的终极武器

基于 Flink SQL CDC 数据处理的终极武器。

overfit同步小助手 2023-08-26 22:04:43 0 收藏

flink oracle cdc实时同步（超详细）

超详细讲解Oracle CDC实时同步

overfit同步小助手 2023-08-25 17:04:08 0 收藏

Flink本地checkpoint测试

flink本地checkpoint测试

overfit同步小助手 2023-08-25 10:04:09 0 收藏

Flink学习笔记（七）并行度详解

一个Flink程序由多个任务（Source、Transformation和Sink）组成。一个任务由多个并行实例（线程）来执行，一个任务的并行实例（线程）数目被称为该任务的并行度。

overfit同步小助手 2023-08-25 05:04:11 0 收藏

一、Flink使用异步算子+线程池查询MySQL

Flink异步查询MySQL使用线程池创建多链接实现多请求

overfit同步小助手 2023-08-25 05:04:06 0 收藏

Flink流批一体计算（14）：PyFlink Tabel API之SQL查询

create_temporary_view(view_path, table) 将一个 `Table` 对象注册为一张临时表，类似于 SQL 的临时表。sql_query(query) 执行一条 SQL 查询，并将查询的结果作为一个 `Table` 对象。Table API 中的 Table

overfit同步小助手 2023-08-25 00:04:05 0 收藏

flink任务性能优化

明确指出，当前内存有限的情况下，使用rocketDB会造成性能损害，因为rocketDB会不停刷内存，造成高io和高cpu。所以在小型化项目时，对状态数据要求不高时，可考虑不使用rocketDB作为状态后端。2、将下游数据需要的数据以参数的形式向下传递。1、使用异步算子，异步执行操作。

overfit同步小助手 2023-08-24 20:03:53 0 收藏

【大数据】Flink 详解（四）：核心篇 Ⅲ

Checkpoint 被叫做检查点，是 Flink 实现容错机制最核心的功能，是 Flink 可靠性的基石，它能够根据配置周期性地基于 Stream 中各个 Operator 的状态来生成 Snapshot 快照，从而将这些状态数据定期持久化存储下来，当 Flink 程序一旦意外崩溃时，重新运行程序

overfit同步小助手 2023-08-24 10:04:24 0 收藏

大数据Flink（五十四）：Flink用武之地

应用较多的如风控系统，当风控系统需要处理各种各样复杂的规则时，Data Driven 就会把处理的规则和逻辑写入到Datastream 的API 或者是ProcessFunction 的API 中，然后将逻辑抽象到整个Flink 引擎，当外面的数据流或者是事件进入就会触发相应的规则，这就是Data

overfit同步小助手 2023-08-24 09:04:35 0 收藏

大数据Flink（五十八）：Flink on Yarn的三种部署方式介绍

这种模式会预先在yarn或者或者k8s上启动一个flink集群，然后将任务提交到这个集群上，这种模式，集群中的任务使用相同的资源，如果某一个任务出现了问题导致整个集群挂掉，那就得重启集群中的所有任务，这样就会给集群造成很大的负面影响。通过以上两种模式的特点描述，可以看出，main方法都是在客户端执行

overfit同步小助手 2023-08-24 09:04:15 0 收藏