大数据 Hive - overfit.cn

Hive HWI 配置

1、下载安装好hive后，发现hive有hwi界面功能，研究下是否可以运行，于是使用hive –service hwi命令启动hwi界面报错。启动hwi功能2、访问192.168.126.110:9999/hwi，发现访问错误一、HWI介绍HWI）是Hive-2-1版本之前的源码中提供的网页控制台工

overfit同步小助手 2024-01-24 21:03:43 0 收藏

Hive表操作

external , 创建外部表partitioned by，分区表clustered by , 分桶表stored as , 存储格式location ，存储位置2.数据类型分类类型描述字面量示例原始类型TINYINT1字节的有符号整数 -128~1271YSMALLINT2字节的有符号整数 -

overfit同步小助手 2024-01-24 17:03:32 0 收藏

Hive行转列[一行拆分成多行/一列拆分成多列]

hive有张表armmttxn_tmp，其中有一个字段lot_number，该字段以逗号分隔开多个值，每个值又以冒号来分割料号和数量，如：A3220089:-40,A3220090:-40,A3220091:-40,A3220083:-40,A3220087:-40,A3220086:-40,A32

overfit同步小助手 2024-01-24 13:03:48 0 收藏

Hive窗口函数整理

Hive 中的窗口函数允许你在结果集的一个特定“窗口”内对行进行计算。这些窗口可以是物理的（基于行在数据中的实际位置）或逻辑的（基于行的一些排序标准）。窗口函数在处理排名、计算累计和或计算移动平均值等问题时特别有用。这只是 Hive 中窗口函数的一个简短列表。当与其他 SQL 功能（如分区、排序和子

overfit同步小助手 2024-01-24 02:03:32 0 收藏

Hive的四种排序方法

hive有四种排序方法: ORDER BY 、SORT BY 、DISTRIBUTE BY 、CLUSTER BY。hive排序方法,hive的排序方式。

overfit同步小助手 2024-01-23 21:03:51 0 收藏

【sentry 到 ranger 系列】一、Sentry 的 Hive 鉴权插件

代码走读 + 图文并茂，直击 Sentry 的 Hive 鉴权插件灵魂深处

overfit同步小助手 2024-01-23 11:03:36 0 收藏

大数据系统常用组件理解（Hadoop/hive/kafka/Flink/Spark/Hbase/ES）

Spark streaming接收kafka、Flume、HDFS、套接字等各种来源实时输入数据，进行处理，处理后结构数据可存储到文件系统、数据库，或显示在可视化图像中；Hive 是构建在Hadoop HDFS上的数据仓库，可以将结构化的数据文件映射成一张数据库表，并提供类SQL查询功能，主要完成海

overfit同步小助手 2024-01-23 06:03:44 0 收藏

大数据数仓建模基础理论【维度表、事实表、数仓分层及示例】

数据仓库建模（Data Warehouse Modeling）是指在数据仓库（Data Warehouse）中组织和设计数据的过程，以便支持数据分析、报告和决策制定。数据仓库是一个集成的、主题导向的数据存储，用于存储来自不同来源的数据，经过清洗、转换和集成，以支持业务分析和决策。主要目标是创建一个能

overfit同步小助手 2024-01-22 16:03:55 0 收藏

大数据开发之Hive（企业级调优）

创建测试用例1、建大表、小表和JOIN后表的语句2、分别向大表和小表中导入数据。

overfit同步小助手 2024-01-22 12:03:42 0 收藏

网约车大数据综合项目——数据分析Hive

【代码】网约车大数据综合项目——数据分析Hive。

overfit同步小助手 2024-01-22 11:03:13 0 收藏

Hive SQL判断一个字符串中是否包含字串的N种方式及其效率

Hive SQL判断一个字符串中是否包含字串的6种方式及其效率

overfit同步小助手 2024-01-21 22:03:15 0 收藏

Hive实战：分科汇总求月考平均分

在这个实战中，我们运用了Hive框架来处理学生的月考成绩数据。具体步骤如下：准备数据：我们准备了三个文本文件，分别包含了语文、数学和英语的月考成绩数据，并将这些数据上传到HDFS的指定目录。启动Hive Metastore服务并连接Hive客户端：我们启动了Hive Metastore服务，并通

overfit同步小助手 2024-01-21 19:03:42 0 收藏

使用Sqoop将Hive数据导出到TiDB

关系型数据库与大数据平台之间的数据传输之前写过一些。我发现一些大家可能会忽略但很重要的地方！所以，请继续看下去，你肯定会有收获的！！！

overfit同步小助手 2024-01-21 11:03:43 0 收藏

Hive ACID事务表

关于hive ACID事务表的一些内容记载

overfit同步小助手 2024-01-21 10:03:44 0 收藏

Hive数据定义（1）

讲述Hive数据定义的基本知识点：数据仓库的创建、数据仓库的查询、数据仓库的修改、数据仓库的删除、表的创建、表的删除

overfit同步小助手 2024-01-21 07:03:49 0 收藏

【hive】Hive中的大宽表及其底层详细技术点

通过选择合适的存储格式、数据分区、列式存储和压缩、列存储索引、数据分桶等底层技术点，可以有效地管理和处理大量列的数据表格。在Hive中，可以选择不同的存储格式来存储大宽表，如文本格式、序列文件格式、列式存储格式等。为了满足这种需求，Hive引入了大宽表（Large Wide Table）的概念，它是

overfit同步小助手 2024-01-21 06:03:48 0 收藏

Hive内核调优(二)

SQL调优过程中需要结合Hive日志分析性能瓶颈，如下是对关键日志进行说明。

overfit同步小助手 2024-01-21 03:03:09 0 收藏

Hive实战：分科汇总求月考平均分

本次实战运用Hive处理学生月考成绩数据，通过创建分区表、加载各科目成绩至对应分区，并使用SQL语句计算平均分，展示了Hive在大数据管理、分析查询及统计计算上的灵活性与便捷性。

overfit同步小助手 2024-01-21 02:03:49 0 收藏

数据仓库命名规范详解

小时(h)、天（d）、周(w)、月（m）、季（q）、年（y）。实时（rt）、小时（h）、天（d）、周（w）、月（m）、季（q）、年（y）、一次性任务（o）、无周期（n）实时（rt）、小时（h）、天（d）、周（w）、月（m）、季（q）、年（y）、一次性任务（o）、无周期（n）实时（rt）、小时（h）、

overfit同步小助手 2024-01-20 23:03:50 0 收藏

Hive实战：网址去重

本实战通过Hive对三个文本文件中的IP地址数据进行整合去重。首先在虚拟机创建并上传文本至HDFS，接着启动Hive服务与客户端，创建外部表加载数据，并用DISTINCT从原始表中提取不重复IP至新内部表，最终成功实现去重目标，展示了Hive处理大规模文本数据的高效能与便捷性。

overfit同步小助手 2024-01-20 04:03:46 0 收藏

Hive HWI 配置

Hive表操作

Hive行转列[一行拆分成多行/一列拆分成多列]

Hive窗口函数整理

Hive的四种排序方法

【sentry 到 ranger 系列】一、Sentry 的 Hive 鉴权插件

大数据系统常用组件理解（Hadoop/hive/kafka/Flink/Spark/Hbase/ES）

大数据数仓建模基础理论【维度表、事实表、数仓分层及示例】

大数据开发之Hive（企业级调优）

网约车大数据综合项目——数据分析Hive

Hive SQL判断一个字符串中是否包含字串的N种方式及其效率

Hive实战：分科汇总求月考平均分

使用Sqoop将Hive数据导出到TiDB

Hive ACID事务表

Hive数据定义（1）

【hive】Hive中的大宽表及其底层详细技术点

Hive内核调优(二)

Hive实战：分科汇总求月考平均分

数据仓库命名规范详解

Hive实战：网址去重

作者榜

资讯小助手

内容小助手

Deephub

奕凯