0


Hive数据分析案例——汽车销售数据分析

使用HiveQL实现来实现,本数据为上牌汽车的销售数据,分为乘用车辆和商用车辆。数据包含销售相关数据与汽车具体参数。数据项包括:时间、销售地点、邮政编码、车辆类型、车辆型号、制造厂商名称、排量、油耗、功率、发动机型号、燃料种类、车外廓长宽高、轴距、前后车轮、轮胎规格、轮胎数、载客数、所有权、购买人相关信息等。

3.1创建数据库works。

3.2创建外部表

(1)在hdfs上创建一个空目录work_car;

(2)在hive中刚刚建立的数据库works下创建表CarData。

3.3导入数据

3.4查询前10条数据

4 需求分析(使结果前十用HiveQL实现):

4.1汽车行业市场分析:

1统计乘用车辆和商用车辆的数量(即非营运和营运车辆)

2统计山西省2013年每个月的汽车销售数量

4.2 用户数据市场分析:

1 统计买车的男女比例

4.3 不同车型销售统计分析:

1统计不同类型车在每年的总销售量

2 统计各品牌汽车销售量,按销售量倒序排序

3按所有权和类型分组统计销量

4.统计不同排量的车的数量(排量分为3级 小排量:1000以下,中排量:1000-3000,大排量3000及以上)

5 针对某一品牌的竞争分析:

1 统计五菱每一个月的销售量

6针对各市销售分析:

1.统计各市销售量,按销量倒序排序


本文转载自: https://blog.csdn.net/m0_57382185/article/details/124931213
版权归原作者 lambda33 所有, 如有侵权,请联系我们删除。

“Hive数据分析案例——汽车销售数据分析”的评论:

还没有评论