1.数据抽取
1.1 逻辑抽取
1.1.1 全量数据抽取
一般发生在我们初始化时,需要一次性将源库(业务系统)的所有数据抽取到数据仓库的ODS层。
比如将一个全表导出数据文件或者查询源表所有数据的SQL语句, 都是全量抽取的例子。
select * from user.person;
1.1.2 增量数据抽取
对于业务系统的更新表,需要在后续的时间里,增量抽取并更新 ODS 的历史表。对于流水表(只增加,不修改的表),全量数据入仓后,后续的数据,只需要按分区存储即可。一般增量数据抽取有 4种方式:
触发器
时间戳
全表数据对比
binlog
这4种方式的对比
方式名称
版权归原作者 high2011 所有, 如有侵权,请联系我们删除。