0


Spark实时(一):StructuredStreaming 介绍

Structured Streaming 介绍

一、SparkStreaming实时数据处理痛点

在Spark2.0之前版本中处理流式数据时使用SparkStreaming模块,SparkStreaming模块有一些痛点问题,问题如下:

1、复杂的编程模式

SparkStreaming编写代码是基于DStream进行,DStream底层是RDD操作,编程时需要编写很多DStream API非常不方便。由于不同开发者编码水平不同,导致不同人编写相同业务逻辑程序执行效率也有很大不同。并且在SparkStreaming中编程时需要创建StreamingContext对象,如果想要使用SQL方式对实时数据进行处理,那么还需要创建SparkSession对象,编程方式非常不方便。
<


本文转载自: https://blog.csdn.net/xiaoweite1/article/details/140648388
版权归原作者 Lansonli 所有, 如有侵权,请联系我们删除。

“Spark实时(一):StructuredStreaming 介绍”的评论:

还没有评论