大数据 Flink - overfit.cn

Flink 学习八 Flink 容错机制 & checkpoint & savepoint

flink checkpoint savepoint 基础概念和使用

overfit同步小助手 2023-10-03 02:03:56 0 收藏

【大数据】Flink 详解（七）：源码篇 Ⅱ

调度器是 Flink 作业执行的核心组件，管理作业执行的所有相关过程，包括 JobGraph 到 ExecutionGraph 的转换、作业生命周期管理（作业的发布、取消、停止）、作业的 Task 生命周期管理（Task 的发布、取消、停止）、资源申请与释放、作业和 Task 的 Faillover

overfit同步小助手 2023-10-02 12:03:53 0 收藏

flink入门-流处理

overfit同步小助手 2023-10-02 10:04:13 0 收藏

大数据Flink（五十九）：Flink on Yarn的三种部署方式介绍以及注意

如果使用的是flink on yarn方式，想切换回standalone模式的话，需要删除文件：【/tmp/.yarn-properties-root】到这里，我们以 Pre-Job 的方式成功部署了 PyFlink 的作业！但是会话模式的话，如果是kill掉任务，其不会执行自动删除这个文件的步骤，

overfit同步小助手 2023-10-02 10:03:55 0 收藏

如何控制Flink代码运行时控制日志级别

在Flink程序中，可以通过设置日志级别来控制控制台输出的信息。要让控制台只打印结果信息，可以将日志级别设置为。，并将日志输出到控制台。在这种配置下，控制台将只显示错误信息和。，并将日志输出到控制台。在这种配置下，控制台将只显示错误信息和。的文件（如果已经存在，请修改相应的配置）。要设置日志级别，请

overfit同步小助手 2023-10-02 09:03:57 0 收藏

深入解读 Flink 1.17

摘要：本文整理自阿里云技术专家，Apache Flink PMC Member & Committer、Flink CDC Maintainer 徐榜江(雪尽) 在深入解读 Flink 1.17 Meetup 的分享。

overfit同步小助手 2023-10-01 20:04:25 0 收藏

十八、Flink自定义多并行Source

Flink自定义多并行Source

overfit同步小助手 2023-10-01 19:04:58 0 收藏

Flink - sink算子

Flink中常见的sink算子，对接Kafka、Redis、ES、自定义sink、jdbc sink。案例代码使用。

overfit同步小助手 2023-10-01 19:04:47 0 收藏

浏览器连不上 Flink WebUI 8081 端口

【代码】浏览器连不上 Flink WebUI 8081 端口。

overfit同步小助手 2023-10-01 08:03:38 0 收藏

FLinkSQL+FlinkCDC

FlinkCDC（standalone模式）读取mysqlBinlog

overfit同步小助手 2023-09-29 13:04:11 0 收藏

flink 从savepoint、checkpoint中恢复数据

flink作业因为故障导致restart strategy失败或升级flink版本重新发布任务，这时就需要从最近的checkpoint恢复。一般而言有两种方案，第一种方案是开启checkpoint且任务取消时不删除checkpoint（调整参数execution.checkpointing.exte

overfit同步小助手 2023-09-29 06:03:37 0 收藏

十二、Flink自定义 FlatMap 方法

Flink自定义FlatMap方法

overfit同步小助手 2023-09-28 17:03:54 0 收藏

RocksDB简介及Flink对其的支持——大数据

在大数据处理框架中，如Flink，RocksDB作为其默认的状态后端，能够保证高效的状态管理和容错恢复能力。Flink借助RocksDB的特性来管理作业的中间结果和状态，并保证在故障恢复时状态数据的一致性和可恢复性。在上面的示例中，我们首先创建了一个StreamExecutionEnvironmen

overfit同步小助手 2023-09-28 17:03:19 0 收藏

flink执行任务运行10h以后挂掉并且报错

我觉得可能是1、因为代码错误运行时间长了有bug，这个是最有可能的(90%) 当时默认的内存是1G，不可能存在着内存不够的原因。我用了hadoop的集群的yarn，以及分析了taskmanager和jobmanager的内存大小、以及分析每个错误的原因。2、没仔细分析Log日志，很多时候想要节省

overfit同步小助手 2023-09-28 16:03:47 0 收藏

flink cdc DataStream api 时区问题

这里主要使用第二种方式。/*** 处理Debezium时间转换的问题* Debezium默认将MySQL中datetime类型转成UTC的时间戳({@link io.debezium.time.Timestamp }) ，时区是写死的无法更改，* 导致数据库中设置的UTC+8，到kafka中变成了多

overfit同步小助手 2023-09-28 08:03:58 0 收藏

Flink 两阶段提交（Two-Phase Commit）协议

flink两阶段提交

overfit同步小助手 2023-09-27 16:04:02 0 收藏

Flink Sql光速入门

flink sql很简单，只要会sql就会写实时应用报表

overfit同步小助手 2023-09-27 14:04:03 0 收藏

流数据湖平台Apache Paimon（二）集成 Flink 引擎

Paimon目前支持Flink 1.17, 1.16, 1.15 和 1.14。本课程使用Flink 1.17.0。环境准备1）上传并解压Flink安装包tar -zxvf flink-1.17.0-bin-scala_2.12.tgz -C /opt/module/2）配置环境变量sudo vim

overfit同步小助手 2023-09-26 05:03:36 0 收藏

Flink SQL之常用函数(二)

例如：select CURRENT_DATE;返回 2021-10-08例如：select CURRENT_TIME;返回 09:25:28.137例如：select CURRENT_TIMESTAMP;返回 2021-10-08T09:23:15.180 --注意和时区有关系例如：select

overfit同步小助手 2023-09-26 03:03:10 0 收藏

Flink的部署模式：Local模式、Standalone模式、Flink On Yarn模式

Local模式、Standalone模式和FlinkonYARN模式是Flink的三种常见部署模式。

overfit同步小助手 2023-09-26 01:03:44 0 收藏