0


大数据面试题

一.SQL

1、查询出每门课程的及格人数和不及格人数

2、使用分段[100-80],[80-60][‹60]来统计各科成绩,分别统计:各分数段人数,课程号和课程名称

3、下面是学生的成绩表(表名score,列名:学号、课程号、成绩)

5.查询没有学全所有课的学生的学号、姓名

6.查询两门以上不及格课程的同学的学号及其平均成绩

二、Hadoop

1、hadoop数据倾斜如何处理

2、Hadoop性能调优

3、hadoop常见的join

三、hive

1、 hive中两个大表实现join操作,简单描述。

2、 hive中排序关键字有哪些?

3、 hive数据倾倾斜,如何处理?

** 四、Spark**

1、RDD机制以及存储级别?

2、 检查点机制

3、 Spark 的工作流程

标签: 面试

本文转载自: https://blog.csdn.net/wanglvip/article/details/124038390
版权归原作者 黑冰vip 所有, 如有侵权,请联系我们删除。

“大数据面试题”的评论:

还没有评论