0


【数据仓库-4】-- 提取、转换、装载(ETL)

1.数据抽取

1.1 逻辑抽取

1.1.1 全量数据抽取

一般发生在我们初始化时,需要一次性将源库(业务系统)的所有数据抽取到数据仓库的ODS层。

比如将一个全表导出数据文件或者查询源表所有数据的SQL语句, 都是全量抽取的例子。
select * from user.person;

1.1.2 增量数据抽取

对于业务系统的更新表,需要在后续的时间里,增量抽取并更新 ODS 的历史表。对于流水表(只增加,不修改的表),全量数据入仓后,后续的数据,只需要按分区存储即可。一般增量数据抽取有 4种方式:

触发器
时间戳
全表数据对比
binlog

这4种方式的对比

方式名称


本文转载自: https://blog.csdn.net/high2011/article/details/129619451
版权归原作者 high2011 所有, 如有侵权,请联系我们删除。

“【数据仓库-4】-- 提取、转换、装载(ETL)”的评论:

还没有评论