大数据 Flink - overfit.cn

大数据职业技能大赛样题(数据采集与实时计算：使用Flink处理Kafka中的数据)

另外对于数据结果展示时，不要采用例如：1.9786518E7的科学计数法）。

overfit同步小助手 2024-03-13 09:03:21 0 收藏

Flink StreamTask启动和执行源码分析

Flink的StreamTask的启动和执行是一个复杂的过程，涉及多个关键步骤。初始化：StreamTask的初始化阶段涉及多个任务，包括Operator的配置、task特定的初始化以及初始化算子的State等。在这个阶段，Flink将业务处理函数抽象为operator，并通过operatorCha

overfit同步小助手 2024-03-13 03:03:42 0 收藏

使用 SPL 高效实现 Flink SLS Connector 下推

在Flink消费SLS数据过程中会全量消费Logstore数据，对于分析不关注的行或列数据，同样会有网络和计算开销，基于此，阿里云Flink SLS Connector 进行了升级，支持通过配置SPL实现SLS数据源的行过滤、列裁剪等下推，在过滤场景下可以有效地减少了网络与计算开销。

overfit同步小助手 2024-03-13 01:03:24 0 收藏

flink消费kafka限制消费速率

overfit同步小助手 2024-03-12 21:03:48 0 收藏

【Flink集群RPC通讯机制（二）】创建AkkaRpcService、启动RPC服务、实现相互通信

overfit同步小助手 2024-03-12 20:03:28 0 收藏

Flink CEP（模式 API Pattern API ）

在Flink的学习过程中，我们已经掌握了从基本原理和核心层的DataStream API到底层的处理函数，再到应用层的Table API和SQL的各种手段，可以应对实际应用开发的各种需求。有了定义好的个体模式，我们可以进一步将这些模式按照一定的顺序连接起来，以定义一个完整的复杂事件匹配规则。在实际应

overfit同步小助手 2024-03-11 18:03:47 0 收藏

为什么选择 Flink 做实时处理

我们平常开发的Java应用系统时没有状态的。Stom的实现方式。微服务架构将系统拆解成不同的独立服务模块，每个模块分别使用各自独立的数据库，这种模式解决了业务系统拓展的问题，但是也带来了新的问题，那就是业务交易数据过于分散在不同的系统中，很难将数据进行集中化管理，对于企业内部进行数据分析或者数据挖掘

overfit同步小助手 2024-03-11 08:03:16 0 收藏

flink-DataStreamAPI篇（1.18）

flink框架（java）

overfit同步小助手 2024-03-11 00:03:22 0 收藏

基于 Kyuubi 实现分布式 Flink SQL 网关

本文整理自网易互娱资深开发工程师、Apache Kyuubi Committer 林小铂的《基于 Kyuubi 实现分布式 Flink SQL 网关》分享。

overfit同步小助手 2024-03-10 22:03:51 0 收藏

Flink 物理执行图

JobManager根据ExecutionGraph对作业进行调度，并在各个TaskManager上部署任务。这些任务在TaskManager上的实际执行过程就形成了物理执行图。物理执行图并不是一个具体的数据结构，而是描述了流处理任务在集群中的实际执行情况。

overfit同步小助手 2024-03-10 15:03:45 0 收藏

【Flink集群RPC通讯机制（三）】AkkaRpcActor设计与实现：接收RPC消息以及处理逻辑

overfit同步小助手 2024-03-10 12:03:19 0 收藏

Flink 学习 | 运行时的架构（包括一些核心概念和提交流程）

Flink 中，并行度相同的 ont to one 算子操作，可以直接连接起来形成一个大的 task 任务，这样，每个 task 会被一个线程执行，这种技术叫算子链。这种模式下，数据流维护着分区及元素的顺序。实际上，每个任务槽就表示了 Task Manager 拥有计算资源的一个固定大小的子集，用来

overfit同步小助手 2024-03-10 10:03:57 0 收藏

【Flink网络数据传输】OperatorChain的设计与实现

overfit同步小助手 2024-03-10 08:03:35 0 收藏

Flink 的高可用性与故障转移策略

1.背景介绍Flink 是一种流处理框架，用于实时数据处理。它具有高吞吐量、低延迟和强大的状态管理功能，使其成为处理大规模流数据的理想选择。然而，在分布式系统中，高可用性和故障转移策略是关键因素。这篇文章将深入探讨 Flink 的高可用性和故障转移策略，以及如何确保 Flink 集群的可靠性和高性能

overfit同步小助手 2024-03-10 06:03:38 0 收藏

【flink番外篇】13、Broadcast State 模式示例-广播维表（2）

系统介绍某一知识点，并辅以具体的示例进行说明。1、Flink 部署系列本部分介绍Flink的部署、配置相关基础内容。2、Flink基础系列本部分介绍Flink 的基础部分，比如术语、架构、编程模型、编程指南、基本的datastream api用法、四大基石等内容。3、Flik Table API和S

overfit同步小助手 2024-03-10 02:03:53 0 收藏

Flink性能优化小结

可以通过开启缓冲消胀机制来简化 Flink 网络的内存配置调整。您也可能需要调整它。如果这不起作用，您可以关闭缓冲消胀机制并且人工地配置内存段的大小和缓冲区个数。针对第二种场景，我们推荐：使用默认值以获得最大吞吐减少内存段大小、独占缓冲区的数量来加快 checkpoint 并减少网络栈消耗的内存量。

overfit同步小助手 2024-03-10 00:03:36 0 收藏

电商风控系统（flink+groovy+flume+kafka+redis+clickhouse+mysql）

需要使用的编写然后其它技术进行各种数据的存储及处理。

overfit同步小助手 2024-03-09 22:03:24 0 收藏

flink类加载器原理与隔离（flink jar包冲突）

Classpath是JVM用到的一个环境变量，它用来指示JVM如何搜索Class。因为Java是编译型语言，源码文件是.java，而编译后的.class文件才是真正可以被JVM执行的字节码。因此，JVM需要知道，如果要加载一个com.dtstack.HelloWorld的类，应该去哪搜索对应的Hel

overfit同步小助手 2024-03-09 19:03:50 0 收藏

【Flink】Flink各版本及新特性

在流式 SQL 查询中，一个最经常使用的是定义时间窗口。Flink 1.13 中引入了一种新的定义窗口的方式：通过 Table-valued 函数。这一方式不仅有更强的表达能力（允许用户定义新的窗口类型），并且与 SQL 标准更加一致。Flink 1.13 在新的语法中支持 TUMBLE 和 HOP

overfit同步小助手 2024-03-09 15:03:56 0 收藏

【极数系列】Flink集成KafkaSink & 实时输出数据（11）

【极数系列】Flink集成KafkaSink（11）旨在帮助读者快速使用Flink集成KafkaSink，直接输出数据到kafka

overfit同步小助手 2024-03-09 14:03:43 0 收藏