0


大数据面试真题_数据仓库

维表和宽表(主要考察维表的使用及维度退化手法)

维表和宽表是数据仓库中常用的两种表设计方式。
1. 维表(Dimension Table):
维表用于存储描述性信息,如产品、时间、地理位置等。它包含一列或多列作为主键,用于连接到事实表。维表一般具有稳定不变的特点,而且通常比事实表要小。
例如,在销售数据仓库中,一个产品维表可以包含产品ID、产品名称、产品类型等描述性属性。维表的结构相对简单,可根据需要进行扩展,用于支持各种查询和分析。
2. 宽表(Fact Table):
宽表用于存储事实数据,即与业务过程相关的事实和度量指标,如销售金额、数量、利润等。宽表通常包含多个外键列,关联到一个或多个维表。
宽表是数据仓库中关注的核心表,它记录了业务过程中发生的事件和度量数据。宽表通常比较大,存储大量的数据记录,并且经常被用于复杂的查询和分析操作。
在维表和宽表之间,通过共享维度键来建立关联关系,形成维度模型。维度模型采用星型模式或雪花模式的结构,以提供灵活的查询和快速的性能。
比如,一个销售事实表可以关联到产品维表、时间维表和地理位置维表。通过维度键的连接,可以方便地进行销售数据的分析,如按产品类别统计销售额、按时间维度分析销售趋势等。
维表和宽表的设计方式需根据具体的业务需求和查询分析要求进行选择。维表适用于描述性信息和维度属性,宽表适用于事实数据和度量指标。两者结合使用,构建数据仓库的维度模型,提供强大的分析能力。

本文转载自: https://blog.csdn.net/m0_55389447/article/details/132038785
版权归原作者 MetaTrade 所有, 如有侵权,请联系我们删除。

“大数据面试真题_数据仓库”的评论:

还没有评论