Hive - overfit.cn

Hive底层数据存储格式

在大数据领域，Hive是一种常用的数据仓库工具，用于管理和处理大规模数据集。Hive底层支持多种数据存储格式，这些格式对于数据存储、查询性能和压缩效率等方面有不同的优缺点。本文将介绍Hive底层的三种主要数据存储格式：文本文件格式、Parquet格式和ORC格式。总结来说，Hive底层数据存储格式的

overfit同步小助手 2023-08-24 15:04:35 0 收藏

Hive数据仓库简介

Hive起源于Facebook，Facebook公司有着大量的日志数据，而Hadoop是实现了MapReduce模式开源的分布式并行计算的框架，可轻松处理大规模数据。然而MapReduce程序对熟悉Java语言的工程师来说容易开发，但对于其他语言使用者则难度较大。因此Facebook开发团队想设计一

overfit同步小助手 2023-08-24 07:04:22 0 收藏

hive删除数据进行恢复

hdfs dfs -cp 回收站目录数据/* 数据表存储目录/对恢复后的数据表进行验证，包括数据内容和数据条数的验证。（2）将回收站里的数据复制到表的数据存储目录。（3）执行hive的修复命令。

overfit同步小助手 2023-08-22 23:04:22 0 收藏

HIVE SQL 根据主键去重并实现其余字段分组聚合

注意：此处是取的首个不为空（即不为null）的字段，所以在实际使用过程中应提前将空字符串转为null值。

overfit同步小助手 2023-08-22 15:04:22 0 收藏

【hive】hive中将string数据转为bigint的操作

【代码】【hive】hive中将string数据转为bigint的操作。

overfit同步小助手 2023-08-22 08:04:18 0 收藏

【Hive】分隔符『单字节分隔符 | 多字节分隔符』

1. 概述2. 单字节分隔符方法：使用delimited关键字3. 其它复杂情况方式一：写MR程序进行字符替换转为单字节分隔符问题（不推荐）方式二：自定义InputFormat转为单字节分隔符问题（不推荐）方式三：使用serde关键字（推荐）

overfit同步小助手 2023-08-22 05:04:10 0 收藏

Hive常见面试题

Hive是一个基于Hadoop生态系统的数据仓库和数据处理工具。它提供了类似于SQL的查询语言（HiveQL），使用户能够使用SQL语句来查询和分析大规模存储在Hadoop集群上的数据。Hive的主要作用是将大数据的处理变得更加易于理解和使用，尤其适合那些熟悉SQL查询语言的非技术用户。Hive

overfit同步小助手 2023-08-22 04:04:18 0 收藏

16个SpringBoot 扩展接口的总结和实例

/ ...通过CacheManagerCustomizer,我们可以自定义ConcurrentMapCacheManager的配置,如缓存名称、过期规则等。主要步骤是实现接口,并声明需要自定义的缓存管理器bean。这样可以根据需要调整Spring Cache的缓存行为。如果大家对相关文章感兴趣，可以

overfit同步小助手 2023-08-21 13:02:31 0 收藏

hive on spark亲自编译，详细教程

编译的spark目录下面的jars文件全部copy到hive/lib下面，将所有的hive/lib jar上传到hdfs目录:hdfs://master:9000/spark-jars/。2、下载spark-2.0.0的源码. https://archive.apache.org/dist/spar

overfit同步小助手 2023-08-21 00:04:30 0 收藏

【Hive】grouping sets() 函数

1. 语法2. 例子

overfit同步小助手 2023-08-19 19:05:11 0 收藏

spring boot 引入hive

可以从Spring容器中自动注入。在这个例子中，使用Hive的。指定Hive的元数据服务地址。指定HDFS的地址，

overfit同步小助手 2023-08-19 06:03:44 0 收藏

hive启动命令

1、启动元数据管理服务（必须启动，否则无法工作）前台启动：bin/hive --service metastore后台启动：nohup bin/hive --service metastore >> logs/metastore.log 2>&1 &2、启动客户端Hive Shell方式（可以直接写

overfit同步小助手 2023-08-19 03:04:36 0 收藏

Windows下安装Hive（包安装成功）

Hive 的Hive_x.x.x_bin.tar.gz 高版本在windows 环境中缺少 Hive的执行文件和运行程序。配置文件目录（%HIVE_HOME%\conf）有4个默认的配置文件模板拷贝成新的文件名。可以发现，自动连接MySQL去创建schema hive，并执行脚本。可以通过访问nam

overfit同步小助手 2023-08-18 21:04:20 0 收藏

Hive之lead函数详解

根据chatgpt生成的回答

overfit同步小助手 2023-08-17 23:04:21 0 收藏

【HiveSQL】定义变量&使用变量

HiveSQL中变量的定义与使用

overfit同步小助手 2023-08-17 13:04:25 0 收藏

Hive的堵塞问题和表锁问题原因查找

当一个用户或任务需要对表进行修改（如插入、更新、删除等操作）时，Hive会自动获取一个表级锁，以防止其他用户或任务同时修改该表。排他锁适用于对表进行写操作，当一个用户或任务获取到了一个表的排他锁时，其他用户或任务将无法修改该表。如果一个用户或任务需要对表进行修改，但另一个用户或任务已经获取了表的锁，

overfit同步小助手 2023-08-17 08:04:03 0 收藏

关于Hive的使用技巧

可以使用SET命令来设置相关参数，如mapreduce.job.reduces、hive.exec.parallel、hive.exec.dynamic.partition.mode等。优化查询：在编写查询语句时，可以使用HiveQL的优化技巧来提高查询性能。分区和桶：使用分区和桶可以提高查询性能。

overfit同步小助手 2023-08-16 03:05:20 0 收藏

【Hive实战】Hive的压缩池与锁

Hive的压缩池与锁

overfit同步小助手 2023-08-16 03:05:03 0 收藏

hive所有窗口函数详情总结

开窗函数用于为行定义一个窗口（指运算将要操作的行的集合），它对一组值进行操作，不需要使用 Group By 子句对数据进行分组，能够在同一行中同时返回基础行的列和聚合列。percent_rank ：窗口内当前行的RANK值-1/窗口内总行数-1(这里的rank值就是指的是rank 函数的的返回值)有

overfit同步小助手 2023-08-16 03:04:57 0 收藏

Hive常见错误及解决办法

overfit同步小助手 2023-08-15 20:04:25 0 收藏