使用HiveQL实现来实现,本数据为上牌汽车的销售数据,分为乘用车辆和商用车辆。数据包含销售相关数据与汽车具体参数。数据项包括:时间、销售地点、邮政编码、车辆类型、车辆型号、制造厂商名称、排量、油耗、功率、发动机型号、燃料种类、车外廓长宽高、轴距、前后车轮、轮胎规格、轮胎数、载客数、所有权、购买人相关信息等。
3.1创建数据库works。
3.2创建外部表
(1)在hdfs上创建一个空目录work_car;
(2)在hive中刚刚建立的数据库works下创建表CarData。
3.3导入数据
3.4查询前10条数据
4 需求分析(使结果前十用HiveQL实现):
4.1汽车行业市场分析:
1统计乘用车辆和商用车辆的数量(即非营运和营运车辆)
2统计山西省2013年每个月的汽车销售数量
4.2 用户数据市场分析:
1 统计买车的男女比例
4.3 不同车型销售统计分析:
1统计不同类型车在每年的总销售量
2 统计各品牌汽车销售量,按销售量倒序排序
3按所有权和类型分组统计销量
4.统计不同排量的车的数量(排量分为3级 小排量:1000以下,中排量:1000-3000,大排量3000及以上)
5 针对某一品牌的竞争分析:
1 统计五菱每一个月的销售量
6针对各市销售分析:
1.统计各市销售量,按销量倒序排序
版权归原作者 lambda33 所有, 如有侵权,请联系我们删除。