大数据 Flink - overfit.cn

Flink开发语言选择：Java vs Scala，哪种更适合你的项目？

Apache Flink作为一种强大的流处理框架，支持Java和Scala两种编程语言开发。对于开发者和企业来说，选择哪种语言来实现Flink应用程序是一个关键决策。本篇博客详细探讨了Java和Scala在Flink开发中的优缺点，从语言特性、性能、社区支持、学习曲线和应用场景等多个角度进行对比分析

overfit同步小助手 2024-08-25 18:03:36 0 收藏

Flink入门(四) -- Flink中的窗口

窗口通常指的是建筑物中用来采光和通风的构件，即窗户。这是“窗口”一词最直接和常见的含义。

overfit同步小助手 2024-08-24 23:03:45 0 收藏

大数据Flink（一百一十一）：开通阿里云Flink全托管

在实时计算控制台上，可以在Flink全托管页签，单击目标工作空间的更多>工作空间详情，查看空间名称、工作空间ID、OSS Bucket、SLB IP、专有网络名称和ID、虚拟交换机等信息。flink-savepoints：在Flink全托管开发控制台上单击Savepoint，会触发Savepoint

overfit同步小助手 2024-08-24 20:03:53 0 收藏

Flink实时数仓（六）【DWD 层搭建（四）交易域、互动域、用户域实现】

Flink 实时数仓 DWD 层搭建，交易域、工具域、用户域事务事实表实现

overfit同步小助手 2024-08-24 07:03:50 0 收藏

数据同步工具之Flink CDC

Flink CDC（Change Data Capture）是基于Apache Flink的一个扩展，用于捕获和处理数据库中的数据变化。它能够实时捕获关系数据库中的数据变更（如插入、更新、删除操作），并将这些变更流式传输到Flink进行处理。以下是Flink CDC的详细介绍：

overfit同步小助手 2024-08-24 04:03:33 0 收藏

确保Apache Flink流处理的数据一致性和可靠性

Apache Flink是一个用于大规模数据流处理的开源框架，它提供了多种机制来保证在分布式环境中数据的一致性和可靠性。在实时流处理中，数据的一致性和可靠性是至关重要的，因为它们直接影响到数据处理结果的准确性和系统的稳定性。本文将详细介绍Flink如何通过不同的机制和策略来确保数据的一致性和可靠性。

overfit同步小助手 2024-08-23 13:03:50 0 收藏

Hologres+Flink企业级实时数仓核心能力介绍

overfit同步小助手 2024-08-23 08:03:55 0 收藏

得物Flink内核探索实践

随着大数据技术的飞速发展，实时处理能力变得越来越重要。在众多实时处理框架中，Apache Flink以其强大的流处理能力和丰富的功能集，受到了广泛关注和应用。在实时业务日益增长的趋势下，这促使我们深入探索Flink的内核，以更好地保障Flink任务的维护。本次分享将重点介绍得物在Flink内核方面的

overfit同步小助手 2024-08-23 05:04:11 0 收藏

Flink1.19源码深度解析-ClusterEntrypoint

如果一个main()方法中有多个env.execute()/executeAsync()，在Application模式下，这些作业会被视为属于同一个应用，在同一个集群中执行（如果在Per-Job模式下，就会启动多个集群）。对于per-job模式，jar包的解析、生成JobGraph是在客户端上执行的

overfit同步小助手 2024-08-22 17:03:51 0 收藏

Dinky 让Flink作业纵享丝滑

Dinky的部署方式还有很多：二进制可执行包部署，源码编译部署，docker-compose部署，k8s部署等，支持多种flink模式提交任务，使用flink支持整库同步、增量和实时CDC数据同步，还集成DolphinScheduler(小海豚调度平台)，支持主流的关系型数据库、OLAP数据库和数据

overfit同步小助手 2024-08-22 13:03:48 0 收藏

大数据——Flink原理

Apache Flink 是一个强大的开源框架和分布式处理引擎，专门用于对无界和有界数据流进行有状态计算。Flink 支持高吞吐量、低延迟的实时数据流处理，同时也能够高效地处理批处理任务。其核心特点包括事件时间处理、有状态操作、容错机制，以及能够在各种常见的集群环境中运行，如 Hadoop、Kube

overfit同步小助手 2024-08-22 08:03:44 0 收藏

Flink单机和集群环境部署教程

通过以上步骤，我们成功部署了 Flink 单机和集群环境，并实现了一个简单的 Word Count 应用。Flink 提供了强大的流处理和批处理能力，可以在多种场景下处理实时数据。

overfit同步小助手 2024-08-22 00:03:38 0 收藏

Flink入门 (二)--Flink程序的编写

其他案例demo可以参考我的GitHubhttps://github.com/NuistGeorgeYoung/flink_stream_test/ 编写一个Flink程序大致上可以分为以下几个步骤：之后你可以设置以下配置- 按行读取文件并将其作为字符串返回。- 按行读取文件并将它们作为Strin

overfit同步小助手 2024-08-21 23:03:47 0 收藏

【大厂Offer】教你如何从Flink小白成为Contributor最终拿到腾讯的Offer

一开始我也是怀揣着成为一个技术大老的梦想开始的，尽管我现在已经入职腾讯三年多了有时候觉得自己还是一个菜鸡哈.....写这个文章希望可以帮助到刚刚接触大数据，并且对技术怀揣着梦想的朋友们，大家互相学习哈

overfit同步小助手 2024-08-21 12:03:39 0 收藏

flink车联网项目：维表离线同步（第69天）

本文为flink车联网项目：维表离线同步，后续章节为：ods层具体实现。

overfit同步小助手 2024-08-21 01:03:48 0 收藏

大数据Flink（一百零六）：什么是阿里云实时计算Flink版

阿里云实时计算Flink版是一种全托管Serverless的Flink云服务，开箱即用，计费灵活。阿里云实时计算Flink版是一套基于Apache Flink构建的⼀站式实时大数据分析平台，提供端到端亚秒级实时数据分析能力，并通过标准SQL降低业务开发门槛，助力企业向实时化、智能化大数据计算升级转型

overfit同步小助手 2024-08-20 07:03:40 0 收藏

flink车联网项目：业务实现2（维表开发）（第68天）

本文为flink车联网项目：业务实现2(维表开发)，后续章节为：维表离线同步。

overfit同步小助手 2024-08-19 23:03:50 0 收藏

Flink1.19JobGraph是如何生成的

16.在这么多代码中，最为核心的就是这一行代码，setChaining（）这个方法从名字上看，就是设置算子链，在这个方法里，完成了JobGraph整体结构的创建和算子任务的合并，由于比较复杂，我这一篇就不赘述了，后面会出一篇单独讲。14.回退出来，调用createJobGraph，对这个jobgra

overfit同步小助手 2024-08-19 12:03:30 0 收藏

Flink 之滚动窗口/滑动窗口/会话窗口/OVER窗口

数据处理方式流式计算：数据是连续不断地到达的，OVER窗口函数会在数据流中实时地计算窗口结果。每当新数据到达时，窗口计算会实时更新。批计算：数据是一次性读取并处理的，OVER窗口函数会在整个数据集上一次性计算窗口结果。所有数据都读取完毕后，窗口计算才会开始。计算延迟流式计算：适用于需要低延迟、实时更

overfit同步小助手 2024-08-19 06:03:27 0 收藏

Flink时间和窗口

如图所示，由事件生成器（Event Producer）生成事件，生成的事件数据被收集起来，首先进入分布式消息队列（Message Queue），然后被 Flink 系统中的 Source 算子（Data Source）读取消费，进而向下游的窗口算子（Window Operator）传递，最终由窗口算

overfit同步小助手 2024-08-18 19:03:28 0 收藏