0


开源多组件数据中台整体框架设计

  亚里士多德的《辩证法》首先提出了“三段论”的论证思维工具,即论据、论点和结论,并指出每个部分都必须具有必要的条件,以确保整个论证的有效性。本文参考该论证思维工具,结合自身的工作经验,来论证下当前为什么“开源多组件数据中台”是政务数据应用的选择之一。

一、什么是数据中台?

  数据中台是一个数据管理的中心平台,它汇聚了各种数据源,包括结构化数据、半结构化数据和非结构化数据,并对这些数据进行清洗、处理、存储和分析,以支持组织的业务决策和数据驱动的业务发展。数据中台的主要功能包括数据整合、数据治理、数据存储、数据分析和数据展示。通过数据中台的建设,组织可以更好地管理和利用数据,提高数据驱动的能力,实现业务的创新和发展。

  数据中台不是一个大应用、大系统,它更像是一套可持续“让数据用起来”的解决方案,是一个具备数据管理和分析平台,旨在整合和治理企业内部和外部的各种数据,将数据转化为可操作的资产,并为组织提供更灵活、高效、低成本的数据分析和挖掘服务。数据中台的组成包括数据准备、数据转换、数据存储、数据分析、数据服务等多个组件模块,以及它们提供相应的技术和服务支持。

请添加图片描述

  图1.开源多组件数据中台架构图

请添加图片描述

  图2.数据仓库架构图

  如上图1,是本文推荐使用的开源多组件数据中台架构图,括号内的组件均为开源的应用组件。主要可以分为数据采集层、数据仓库层(也叫数据存储)、数据治理分析层、数据服务层四层。其中:

  1. 数据采集包括采集、清洗、处理和存储等步骤,将原始数据转化为可用于分析和挖掘的格式。
  2. 数据仓库(数据存储)是将数据存储在集中式的数据库中,包括关系型数据库、非关系型数据库等,实现数据的高效存储和管理。
  3. 数据治理分析是对数据进行全面的治理,包括数据质量管理、元数据管理、数据安全等方面。通过对数据进行治理,可以确保数据的准确性、可靠性和安全性,并且可以提高数据的使用效率。
  4. 数据服务将数据服务集成在一起,为企业提供更灵活、高效、低成本的数据分析和挖掘服务,支持业务决策和发展;同时还提供了可视化的工具,可以将数据分析结果以图表的形式展示出来,方便用户快速了解数据分析结果。

  如上图2,是本文推荐使用的数据仓库(数据存储)架构图。主要也分为数据贴源层(ODS)、基础明细层(DWD)、轻度汇总层(DWS)、主题应用层(DM)。其中:

  1. 数据贴源层(ODS)主要负责采集数据,包括从各个业务系统、数据库或者其他数据源中获取数据。
  2. 基础明细层(DWD)是数据仓库中的一个核心层,主要用于支撑数据仓库的核心业务需求。在这一层中,会将从数据源层获取的数据按照主题建立各种数据模型,包括基础的明细数据、维度数据等,以支撑数据仓库中的多维分析和数据挖掘任务。
  3. 轻度汇总层(DWS)是数据仓库中的一个过渡层次,主要用于对DWD层的生产数据进行轻度综合和汇总统计。轻度汇总层的主要功能是对DWD层的数据进行汇总和统计,将其转换为更易于分析和挖掘的格式,以支撑分析型应用的需求。
  4. 主题应用层(DM)是数据仓库中的一个应用层,主要用于支撑主题业务需求。在这一层中,会将从数据源层获取的数据按照主题建立各种数据模型,包括基础的明细数据、维度数据等,以支撑主题业务需求。</

本文转载自: https://blog.csdn.net/qq_28097847/article/details/130799160
版权归原作者 开源数据中台 所有, 如有侵权,请联系我们删除。

“开源多组件数据中台整体框架设计”的评论:

还没有评论