根据个人理解整理,大佬们有更好的想法可以评论
Row
首先,Row是一种固定长度、可识别空值的复合类型,使用确定的字段顺序存储多个值。 无论字段的类型如何,每个字段都可以为空。 无法自动推断行字段的类型; 因此,无论何时生成一行,都需要提供类型信息。
Row 的主要目的是在 Flink 的 Table 和 SQL 生态系统以及其他 API 之间架起一座桥梁。 因此,行不仅由模式部分(包含字段)组成,而且还附加了一个 RowKind 用于对更改日志中的更改进行编码。 因此,可以将一行视为更改日志中的一个条目。 例如,在常规批处理方案中,更改日志将包含 RowKind.INSERT 行的有界流。 行种类与字段分开,可以使用 getKind() 和 setKind(RowKind) 访问。
Row有三种模式:
Position-based field mode:根据位置设置field
Name-based field mode:根据fieldName设置
Hybrid / named-position field mode:混合模式
RowData
首先,RowData是一个接口噢,有很多基于接口的实现,其中可以看下GenericRowData的构造函数,基本就明白了,传入rowKind以及参数个数。RowData是在运行时通过 Table API 或 SQL 管道传输的所有顶级接口。
private final Object[] fields;
private RowKind kind;
public GenericRowData(RowKind kind, int arity) {
this.fields = new Object[arity];
this.kind = kind;
}
所以总结下来可以这样理解,Row为RowData的低阶数据类型,常常用于DataStream中的使用;而RowData是通过不同的Conveter转换Row得到的高阶数据,用于TableAPI和Sql中使用 ;两者中的存储内容基本是一致的。
版权归原作者 yann.bai 所有, 如有侵权,请联系我们删除。