大数据 Hive - overfit.cn

[hive] 窗口函数 ROW_NUMBER()

在 Hive SQL 中，是一个用于生成行号的窗口函数。它可以为。以下是子句可选，用于指定，它将结果集划分为不同的分区。每个分区内的行都会有独立的行号计数，即行号从1开始重新计数。ORDER BY子句用于指定，它决定了如何对分区内的行进行排序。行号将根据指定的排序顺序进行分配。函数可以与其他窗口函数

overfit同步小助手 2023-11-30 19:03:50 0 收藏

Hive创建分区表并插入数据

静态分区在插入数据时要指定分区名，支持load、insert两种插入方式，主要用于分区少，分区名可以确定的情况。

overfit同步小助手 2023-11-30 16:03:41 0 收藏

[shell,hive] 在shell脚本中将hiveSQL分离出去

将Hive SQL语句写在单独的.hql文件中，然后在shell脚本中调用这些文件来执行Hive查询。这样可以将SQL语句与shell脚本分离，使代码更加清晰和易于维护。

overfit同步小助手 2023-11-29 23:03:22 0 收藏

Hive 动态分区以及分区以及中文分区字段

hive 提供了一个动态分区功能，其可以基于查询参数的位置去推断分区的名称，从而建立分区。

overfit同步小助手 2023-11-28 13:03:42 0 收藏

大数据技术之Hive SQL题库-中级

overfit同步小助手 2023-11-27 14:03:51 0 收藏

Hive复杂数据类型(array类型、map类型、struct类型)

一、array类型建表语句：create table 表名(要素1 类型，要素2 类型，要素3 array) row format delimited fileds terminated by '\t' collection items terminated by ',';

overfit同步小助手 2023-11-27 09:03:31 0 收藏

[hive]维度模型分类:星型模型,雪花模型,星座模型|范式

z=f(x,y)当给定x,y则能计算出z,当给x,y,n时，也能计算出z，此时z部分函数依赖于z,y,n。比如通过（学号，课程）推出姓名，因为可以直接通过学号退出姓名，所以：姓名部分依赖于（学号，课程）。星型模型中只有一张事实表，以及0张或多张维度表，事实与纬度表通过主键外键相关联，维度之间不存在关

overfit同步小助手 2023-11-27 01:03:57 0 收藏

hive sql 行列转换开窗函数炸裂函数

讲师表 teacher.csv课程表 course.csv分数表 score.csv员工表 emp.csv雇员表 employee.csv电影表 movie.txt订单表 order.csv创建数据库和数据表行列转换列转行行专列

overfit同步小助手 2023-11-26 21:03:53 0 收藏

Hadoop3.0大数据处理学习1（Haddop介绍、部署、Hive部署）

Hadoop是一个适合海量数据存储与计算的平台。是基于Google的GoogleFS、Map Reduce、BigTable实现的。移动数据：数据 -> 计算程序移动计算：计算程序 -> 数据分布式计算：各个节点局部计算 -> 第二阶段汇总程序官方版本：Apache Hadoop，开源，集群安装维护

overfit同步小助手 2023-11-26 14:03:47 0 收藏

[Hive] 查询结果保存

此外，还可以使用INSERT INTO语句来将查询结果追加到表或分区中，而不是覆盖现有的数据。上述示例将从表table_name中选择满足条件的数据，并将结果以文件的形式覆盖输出到指定的目录/path/to/directory。需要注意的是，使用INSERT OVERWRITE DIRECTORY语

overfit同步小助手 2023-11-26 13:03:14 0 收藏

一百八十八、Hive——HiveSQL查询表中的日期是星期几（亲测，附截图）

HiveSQL查询表中的日期是星期几（亲测，附截图）

overfit同步小助手 2023-11-25 11:03:40 0 收藏

hadoop搭建、mysql、hive部署

大数据基础项目，基于hadoop、mysql、hive实现数据分析

overfit同步小助手 2023-11-25 08:03:52 0 收藏

iceberg学习笔记（2）—— 与Hive集成

本文介绍了iceberg框架如何与hive进行集成

overfit同步小助手 2023-11-25 04:03:32 0 收藏

【Hive进阶】-- 导出 hive 表数据的几种方式

在日常的工作中，常常会有导出 hive 表数据的需求。在此，我整理了如下几种方式，供大家参考。然后使用 hdfs 命令下载。

overfit同步小助手 2023-11-25 04:03:15 0 收藏

Hive内部表（管理表）和外部表的区别【重点】

一、内部表和外部表的区别：内部表和外部表的区别可以从三方面讨论，创建表时、删除表时、选择表时： ...

overfit同步小助手 2023-11-24 05:03:49 0 收藏

第1关：Hive 的 Alter Table 操作

Alter 表/列第1关：Hive 的 Alter Table 操作

overfit同步小助手 2023-11-23 23:03:21 0 收藏

大数据开发之Hive案例篇9-Not yet supported place for UDAF ‘count‘

后面把order by子句注释掉之后，居然就可以了，那么就是order by 后面不能跟聚合函数了。一个很简单的group by和count(*) 操作，然后居然报错了。大概是在Oracle MySQL上写SQL写习惯了，以为可以这么写。于是使用了聚合函数的别名，问题搞定。出了问题也是不知道从何排查

overfit同步小助手 2023-11-23 15:03:26 0 收藏

hive on spark集群环境部署（彻底摆脱做毕设没环境）

hive on spark环境部署

overfit同步小助手 2023-11-23 00:03:45 0 收藏

基于Kylin的数据统计分析平台架构设计与实现

前言此项目是我在TP-LINK公司云平台部门做的一个项目，总体包括云上数据自动化统计流程的设计和组件的开发。目的是为了对云平台上的设备和用户数据做多维度的统计和分析，以及便于观察设备数据的历史趋势，让业务部门更好地做业务决策。整体的架构与数据流向如下图所示，采用Hive做数据仓库，使用Spark实现

overfit同步小助手 2023-11-22 18:03:51 0 收藏

hive sql 拆解字段

在Hive SQL中，拆解字段通常涉及到字符串操作，如将一个包含多个部分的字符串拆解成多个独立的字段。2. SPLIT(str, delimiter)：使用SPLIT函数可以根据指定的分隔符将字符串拆分为一个数组，这对于将含有多个值的字符串拆分成独立的字段非常有用。你可以指定起始位置和要提取的长度。

overfit同步小助手 2023-11-22 16:03:37 0 收藏