在flinkCDC源数据配置中,只对表中的部分字段关注,通过监控部分字段进行数据更新或者不更新,对数据进行同步。主要通过以下两个参数:
column.exclude.list
默认: 空字符串
一个可选的、以逗号分隔的正则表达式列表,与列的完全限定名称匹配以从更改事件记录值中排除。列的完全限定名称的格式为databaseName。表名。列名。
column.include.list
默认: 空字符串
一个可选的、以逗号分隔的正则表达式列表,与列的完全限定名称匹配以包含在更改事件记录值中。列的完全限定名称的格式为databaseName。表名。列名。
单表可以只写列名,如果是多表、多库,必须要:databaseName.表名.列名,这种方式的配置。
REATE TABLE IF NOT EXISTS
test_source
(
testid
varchar ( 32 ),
name
int,
addre
varchar ( 100 ),
stat
int,
updateTime
TIMESTAMP,PRIMARY KEY (
testid
) NOT ENFORCED) WITH (
'connector' = 'mysql-cdc',
'hostname' = '*******',
'port' = '**',
'username' = '***',
'password'='********',
'database-name' = 'dbname',
'scan.startup.mode' = 'initial',
'debezium.skipped.operations'='d,c',
'table-name' = 'tablename',
'debezium.column.include.list'='name,addre'
);
版权归原作者 ITZHIHONH 所有, 如有侵权,请联系我们删除。