flink cdc多种数据源安装、配置与验证(超详细总结)
超详细总结flink cdc多种数据源安装、配置与验证
Spark入门(一篇就够了)
Spark 是当今大数据领域最活跃、最热门、最高效的大数据通用计算平台之一。尽管 相对于 而言具有较大优势,但 并不能完全替代 ,主要用于替代中的 计算模型。存储依然可以使用 ,但是中间结果可以存放在内存中;调度可以使用 内置的,也可以使用更成熟的调度系统 等。实际上,已经很好地融入了
Spark入门(一篇就够了)
Spark 是当今大数据领域最活跃、最热门、最高效的大数据通用计算平台之一。尽管 相对于 而言具有较大优势,但 并不能完全替代 ,主要用于替代中的 计算模型。存储依然可以使用 ,但是中间结果可以存放在内存中;调度可以使用 内置的,也可以使用更成熟的调度系统 等。实际上,已经很好地融入了
Flink Catalog解读
Catalog在Flink中提供了一个统一的API,用于管理元数据,并使其可以从 Table API 和 SQL 查询语句中来访问。Catalog提供了元数据信息,例如数据库、表、分区、视图以及数据库或其他外部系统中存储的函数和信息。......
实时计算知识,最详细的整理
随着云计算、大数据等名词的流行,涌现出一大批相关的技术,其中Hadoop是较早出现的一种分布式架构,得到了大量的应用。本章先说明大数据和Hadoop的基本概念,之后介绍HDFS、MapReduce、YARN三个基本的Hadoop组件。除了基本组成部分,Hadoop生态圈中还有很多其他的工具组件,它们