0


hive sql—开窗函数—累积求和和滑动求和

1、数据介绍

数据集有三列数据,姓名、月份和数量:

图1

2、累积求和

使用**sum()函数和over()**来实现,如下:

sum(需要求和的列) over(partition by 分组列 order by 排序列 asc/desc)
具体如下:
select
*,
sum(cnt) over(partition by name order by month) as total_cnt
from
table

结果如下:同一个name,后一个月份都是前几个月份的累加和

图2

3、滑动求和

需要稍微骚一点的操作,加上一个限制条件:

sum(需要求和的列) over(partition by 分组列 order by 排序列 ROWS between 数字 preceding and 数字 following)
距离:统计最近三个月的cnt和,包含当前月
select 
*,
sum(cnt) over(partition by name order by month ROWS between 2 preceding and 0 following) as total_cnt
from table_1;

数字:可正可零可负,正往前,负向后;preceding:向前几行;following:向后几行。三个参数交叉组合。

结果如下:其他的都类似,尝试几下就好

图3

标签: hive sql 大数据

本文转载自: https://blog.csdn.net/SnailPace/article/details/127667279
版权归原作者 蜗牛style 所有, 如有侵权,请联系我们删除。

“hive sql—开窗函数—累积求和和滑动求和”的评论:

还没有评论