Hive笔记-6

6.2.8 聚合函数

1) 语法

count(*)，表示统计所有行数，包含null值；
count(某列)，表示该列一共有多少行，不包含null值；
max()，求最大值，不包含null，除非所有值都是null；
min()，求最小值，不包含null，除非所有值都是null；
sum()，求和，不包含null。
avg()，求平均值，不包含null。

2) 案例实操

(1) 求总行数 (count)

hive (default)> select count(*) cnt from emp;

hive sql执行过程：

count不仅可以传一个

还可以传一个

(字段)

null 值是不统计在内

null 值是不会被统计在内的

(2) 求工资的最大值 (max)

hive (default)> select max(sal) max_sal from emp;

hive sql执行过程：

(3) 求工资的最小值 (min)

hive (default)> select min(sal) min_sal from emp;

hive sql执行过程：

(4) 求工资的总和 (sum)

hive (default)> select sum(sal) sum_sal from emp;

hive sql执行过程：

(5) 求工资的平均值 (avg)

hive (default)> select avg(sal) avg_sal from emp;

hive sql执行过程：

6.3 分组

6.3.1 Group By 语句

Group By语句通常会和聚合函数一起使用，按照一个或者多个列队结果进行分组，然后对每个组执行聚合操作。

1) 案例实操:

把job分组后查看

select count(*) from emp group by job

结果:

看起来有点不太对劲,再改一下:

在count(*)前面加个job

现在看的清楚多了

注意:

注意: 当你 group by job 的时候,

那你只能select 后面跟 job 不能是其他的字段

(1) 计算emp表每个部门的平均工资

hive (default)> 
select 
    t.deptno, 
    avg(t.sal) avg_sal 
from emp t 
group by t.deptno;

hive sql执行过程：

（2）计算emp每个部门中每个岗位的最高薪水。

hive (default)>
select 
    t.deptno, 
    t.job, 
    max(t.sal) max_sal 
from emp t 
group by t.deptno, t.job;

hive sql执行过程：

6.3.2 Having 语句

1) having 与 where 不同点

(1) where 后面不能写分组聚合函数,而having后面可以使用分组聚合函数

(2) having 只用于 group by 分组统计语句

2) 案例实操

找这张表里人数大于等于2的:

输入代码:

得到输出结果:

但是当我不想要嵌套子查询时:

可见where字句行不通

因为where是用来过滤一行一行的数据

而已经group by 分组过了,where不能过滤组

于是我们只能用having来过滤一组一组的数据

那我们就用having:

(1) 求每个部门的平均薪水大于2000的部门

1.求每个部门的平均工资

hive (default)> 
select 
    deptno, 
    avg(sal) 
from emp 
group by deptno;

hive sql执行过程：

2.求每个部门的平均薪水大于2000的部门

hive (default)>
select 
    deptno, 
    avg(sal) avg_sal 
from emp 
group by deptno  
having avg_sal > 2000;

hive sql执行过程：

标签： hive 笔记 hadoop

本文转载自: https://blog.csdn.net/2401_83660667/article/details/139959647
版权归原作者 shadown7z 所有，如有侵权，请联系我们删除。

6.2.8 聚合函数

1) 语法

2) 案例实操

(1) 求总行数 (count)

(2) 求工资的最大值 (max)

(3) 求工资的最小值 (min)

(4) 求工资的总和 (sum)

(5) 求工资的平均值 (avg)

6.3 分组

6.3.1 Group By 语句

1) 案例实操:

(1) 计算emp表每个部门的平均工资

6.3.2 Having 语句

1) having 与 where 不同点

(1) where 后面不能写分组聚合函数,而having后面可以使用分组聚合函数

(2) having 只用于 group by 分组统计语句

2) 案例实操

(1) 求每个部门的平均薪水大于2000的部门

1.求每个部门的平均工资

2.求每个部门的平均薪水大于2000的部门

发表评论

“Hive笔记-6”的评论:

关于作者

overfit同步小助手

相关阅读

文章导航