Hive - overfit.cn

数仓工具—Hive进阶之StorageHandler(23)

当在Apache Hive中定义和操作表时，涉及到的数据的输入和输出以及数据的序列化和反序列化都需要明确定义，这就是 InputFormat、OutputFormat 和 SerDe 的作用。存储处理程序通过指定合适的 InputFormat、OutputFormat 和 SerDe，定义了与特定存

overfit同步小助手 2024-01-12 16:03:24 0 收藏

解决Hive在DataGrip 中注释乱码问题

COLUMNS_V2 表中的 COMMENT 字段存储了 Hive 表所有字段的注释，TABLE_PARAMS 表中的 PARAM_VALUE 字段存储了所有表的注释。数据库中的字符都是通过编码存储的，写入时编码，读取时解码。修改字段编码并不会改变此前数据的编码方式，依然为默认的 latin1，此时

overfit同步小助手 2024-01-12 09:03:29 0 收藏

Hive实战：词频统计

在本次实战中，我们任务是在大数据环境下使用Hive进行词频统计。首先，我们在master虚拟机上创建了一个名为test.txt的文本文件，内容包含一些关键词的句子。接着，我们将该文本文件上传到HDFS的目录，作为数据源。随后，我们启动了服务和Hive客户端，为数据处理做准备。在Hive客户端中，我们

overfit同步小助手 2024-01-12 00:03:44 0 收藏

大数据Hive篇：explode 和 posexplode

explode

overfit同步小助手 2024-01-12 00:03:27 0 收藏

【HIVE】数据的定义与操作

Hive作为数据仓库，用来存放企业的海量数据，Hive提供了丰富的数据类型，如关系型数据库，且提供了关系型数据库不支持的数据类型。

overfit同步小助手 2024-01-11 11:03:34 0 收藏

Hive-concat_ws 详解

该函数将使用指定的分隔符将所有提供的字符串或字符串数组连接在一起。它接受任意数量的参数，并且可以用于连接单个字符串或字符串数组。是 Hive 中的一个函数，用于在给定分隔符的情况下连接字符串数组或字符串。的参数中有 NULL 值，那么连接的结果中将会忽略这些 NULL 值。在上面的示例中，我们使用逗

overfit同步小助手 2024-01-11 10:03:36 0 收藏

Hive内核调优（一）

注：CPU时间：表示运行程序所占用服务器CPU资源的时间。用户等待耗时：记录的是用户从提交作业到返回结果期间用户等待的所有时间。

overfit同步小助手 2024-01-10 14:03:46 0 收藏

Spark内容分享(二十六)：Hive SQL 迁移 Spark SQL 在网易传媒的实践

回顾整个方案的设计过程，实际上没有太多选择的余地，在没法在spark引擎层做兼容的前提，和以脚本提交任务的现状下，只能选择基于git版本管理的自动化迁移流程。方案能这么顺利实施，主要因为任务代码是以脚本的形式存在，这样我们可以很方便的用各种程序处理脚本源代码，避免了大量重复性的工作，特别是用git进

overfit同步小助手 2024-01-09 22:03:47 0 收藏

Hive01_安装部署

上传mysql jdbc驱动到hive安装包lib下。在hdfs创建hive存储目录（如存在则不用操作）解决Hive与Hadoop之间guava版本差异。

overfit同步小助手 2024-01-09 16:03:17 0 收藏

【湖仓一体尝试】MYSQL和HIVE数据联合查询

爬了两天大大小小的一堆坑，今天把一个简单的单机环境的流程走通了，记录一笔

overfit同步小助手 2024-01-09 03:03:44 0 收藏

HIVE笔记

返回两个表中满足关联条件的记录。

overfit同步小助手 2024-01-09 02:03:33 0 收藏

虚拟机安装单机hive以及简单使用hive

hive是我打算了解的有一个大数据方面的一个技术栈，上一篇介绍了Hadoop和hbase，有兴趣的朋友可以点击“文章”浏览，今天要介绍的hive也是要基于hadoop的，安装hive也要提前安装好hadoop。刚了解这块的朋友肯定就会疑问这三者之间的关系是什么呢，从我这段时间对它们的简单了解，我的理

overfit同步小助手 2024-01-09 00:03:45 0 收藏

Hive DDL语法

Hive的语法和MySQL大部分都相同。

overfit同步小助手 2024-01-08 16:03:50 0 收藏

最全HSQL命令大全(Hive命令)

最全HSQL命令中文解释，值得收藏

overfit同步小助手 2024-01-08 01:03:47 0 收藏

Hive实战：词频统计

在本次实战中，我们任务是在大数据环境下使用Hive进行词频统计。首先，我们在master虚拟机上创建了一个名为test.txt的文本文件，内容包含一些关键词的句子。接着，我们将该文本文件上传到HDFS的目录，作为数据源。随后，我们启动了服务和Hive客户端，为数据处理做准备。在Hive客户端中，我们

overfit同步小助手 2024-01-07 22:03:50 0 收藏

hive简介和安装

hive是基于hadoop的数据仓库工具。hive提供了一种使用sql语句来读、写、管理基于分布式系统的大型数据的功能。将hdfs上的结构化数据文件映射为一张表，并提供类似sql语句进行查询统计功能。本质就是将sql语句转化为模板化了的MapReduce程序，处理计算还是hdfs中的mapreduc

overfit同步小助手 2024-01-06 20:03:41 0 收藏

【项目实战】基于Hadoop大数据电商平台用户行为分析与可视化系统Hive、Spark计算机程序开发

overfit同步小助手 2024-01-06 20:03:28 0 收藏

hive插入动态分区数据时，return code 2报错解决

如果上面语句没有解决，可以看下yarm配置，考虑是否是语句占用内存超过配置最大内存等等。大概率是因为没有开启允许动态分区或单次动态分区个数太小了。

overfit同步小助手 2024-01-06 13:03:58 0 收藏

Hive04_DDL操作

因此，使用内部表时，Hive会自动管理表的数据和元数据，而使用外部表时，则需要人工管理表的数据文件，但是可以让多个 Hive 实例共享同一个数据文件。通常情况下，如果数据只会被 Hive 使用，建议使用内部表，而如果数据需要被其他程序或服务使用，建议使用外部表。

overfit同步小助手 2024-01-06 03:03:17 0 收藏

Hadoop、Hive安装

hadoop hive安装

overfit同步小助手 2024-01-05 12:03:46 0 收藏

数仓工具—Hive进阶之StorageHandler(23)

解决Hive在DataGrip 中注释乱码问题

Hive实战：词频统计

大数据Hive篇：explode 和 posexplode

【HIVE】数据的定义与操作

Hive-concat_ws 详解

Hive内核调优（一）

Spark内容分享(二十六)：Hive SQL 迁移 Spark SQL 在网易传媒的实践

Hive01_安装部署

【湖仓一体尝试】MYSQL和HIVE数据联合查询

HIVE笔记

虚拟机安装单机hive以及简单使用hive

Hive DDL语法

最全HSQL命令大全(Hive命令)

Hive实战：词频统计

hive简介和安装

【项目实战】基于Hadoop大数据电商平台用户行为分析与可视化系统Hive、Spark计算机程序开发

hive插入动态分区数据时，return code 2报错解决

Hive04_DDL操作

Hadoop、Hive安装

作者榜

资讯小助手

内容小助手

Deephub

奕凯