Hive - overfit.cn

hive中复杂数据类型(array，map，struct)讲解

hive复杂数据类型的创建、查询与使用

overfit同步小助手 2024-06-11 05:03:45 0 收藏

摸鱼大数据——Hive表操作——分区表

特点: 分区表会在HDFS上产生目录。查询数据的时候使用分区字段筛选数据，可以避免全表扫描，从而提升查询效率注意: 如果是分区表，在查询数据的时候，如果没有使用分区字段，它回去进行全表扫描，会降低效率只需要记住一点，分区表是用来提升Hive的数据分析效率。

overfit同步小助手 2024-06-11 00:03:13 0 收藏

Hive 日期处理函数汇总

最近项目处理日期操作比较繁杂,使用Hive的日期函数也较频繁。

overfit同步小助手 2024-06-09 19:03:24 0 收藏

Hive中高频常用的函数和语法

如果没有前面的行（例如，当前行是第一行），则返回指定的默认值。在这些示例中，LAG()函数被用于获取结果集中的前一行的值，以进行相关的计算或分析。功能介绍： IFNULL(expression, default_value)函数用于处理NULL值，当表达式的值为NULL时，返回指定的默认值，以确保结

overfit同步小助手 2024-06-09 16:03:54 0 收藏

Hive的常规操作

overfit同步小助手 2024-06-08 22:03:27 0 收藏

hive--字符串截取函数substr(),substring()

语法:返回值:string说明：返回字符串Ahiveselectsubstr'abcde'3cdehiveselectsubstring'abcde'3cdehiveselectsubstr'abcde'-1e语法:返回值:string说明：返回字符串A举例：hiveselectsub

overfit同步小助手 2024-06-08 12:03:37 0 收藏

Hive常见的面试题（十二道）

UDF（普通函数，⼀进⼀出，可以⽤于字符串处理、⽇期处理）第一种是比较简单的形式，继承 UDF 类通过 evaluate 方法实现，目前已过时。第二种是继承 GenericUDF 重写 initialize 方法、evaluate 方法、getDisplayString 方法实现。

overfit同步小助手 2024-06-07 17:03:48 0 收藏

Hive SQL的各种join总结

join时的最后一个表会通过reducer流式传输，并在其中缓冲之前的其他表，因此，将大表放置在最后有助于减少reducer阶段缓存数据所需要的内存。包含左、右两个表的全部行，不管另外一边的表中是否存在与它们匹配的行在功能上，它等价于对这两个数据集合分别进行左外连接和右外连接，然后再使用。左表数据

overfit同步小助手 2024-06-06 23:03:42 0 收藏

大数据之Hive:regexp_extract函数案例

符号含义实列做为转意，即通常在"/"后面的字符不按原来意义解释如" * “匹配它前面元字符0次或多次，/a*/将匹配a,aa,aaa，加了”/"后，/a/* /将只匹配"a* "匹配任何一个字符匹配一个输入或一行的开头/^a/匹配"an A"，而不匹配"An a"匹配一个输入或一行的结尾/a$/匹配

overfit同步小助手 2024-06-06 21:03:38 0 收藏

一篇文章教会你如何搭建hive数据库

（此图为Apache Hive官网的截图，具体网址为Hive是基于Hadoop的数据仓库工具，可以用来对HDFS中存储的数据进行查询和分析。Hive能够将HDFS上结构化的数据文件映射为数据库表，并提供SQL查询功能，将SQL语句转变成MapReduce任务来执行。Hive通过简单的SQL语句实现快

overfit同步小助手 2024-06-06 20:03:43 0 收藏

Hive 基本操作命令与介绍

Hive是一个基于Hadoop的数据仓库工具，它提供了类似于SQL的查询语言HiveQL来对存储在Hadoop集群中的数据进行查询和分析。

overfit同步小助手 2024-06-06 07:03:50 0 收藏

Educoder中Hive综合应用案例——用户学历查询

Hive综合应用案例——用户学历查询

overfit同步小助手 2024-06-06 02:03:34 0 收藏

DBeaver连接含有Kerberos认证的集群的Hive表

以DBeaver为例，连接含有Kerberos认证的集群的Hive表。

overfit同步小助手 2024-06-06 01:03:43 0 收藏

Hive-Sql复杂面试题

3、rollup是卷起的意思，俗称层级聚合，相对于grouping sets能指定多少种聚合，而with rollup则表示从左往右的逐级递减聚合，如:group by a,b,c with rollup 等价于 group by a, b, c grouping sets( (a, b, c),

overfit同步小助手 2024-06-05 13:03:51 0 收藏

hive中struct相关函数总结

2、named_struct(name1, value1, name2, value2, …)：创建一个 Named Struct 对象，由多个名称和对应的值组成。1、struct(field1, field2, …)：创建一个 Struct 对象，由多个字段组成。如何将上述struct类型的数据转

overfit同步小助手 2024-06-05 10:03:14 0 收藏

大数据面试题 —— Hive

（1）承UDF或者UDAF或者UDTF，实现特定的方法；（2）打成jar包，上传到服务器（3）执行命令add jar路径，目的是将 jar 包添加到 hive 中create temporary function 函数名 as "自定义函数全类名"（5）在select中使用 UDF 函数。

overfit同步小助手 2024-06-05 09:03:50 0 收藏

hive 之 insert into 和 insert overwrite 的区别和用法（实战）

hive 之 insert into 和 insert overwrite 的区别和用法

overfit同步小助手 2024-06-05 08:03:56 0 收藏

Hive连接方式（本文梳理与datagrip连接）

1.确保HIve已经正确安装完毕，如已正确成功安装Hive，随时随地输入Hive启动即可首先要确保集群成功启动，否则hive会failed；2.启动成功之后，就可以做Hive的相关操作了，出现以下操作 -------成功！

overfit同步小助手 2024-06-05 08:03:42 0 收藏

Hive运行错误

查询hadoop日子：/bin/bash: /bin/java: No such file or directory。删除一个文件一个目录: derby.log和metastore_db。注意：用hadoop的完整地址，不能使用。

overfit同步小助手 2024-06-05 06:03:53 0 收藏

ubuntukylin-22.04.1安装Hive、MySQL、配置Hive及Hive连接MySQL操作

ubuntu系统下安装Hive、MySQL、配置Hive及Hive连接MySQL详细操作（附过程图）

overfit同步小助手 2024-06-04 01:03:33 0 收藏