大数据 Hive - overfit.cn

hadoop学习---基于Hive的聊天数据分析报表可视化案例

聊天平台每天都会有大量的用户在线，会出现大量的聊天数据，通过对。

overfit同步小助手 2024-06-01 00:03:58 0 收藏

Hive3.1.3详细安装配置教程及安装时问题解决

可能会出现错误 Exception in thread "main" java.lang.NoSuchMethodError: com.google.common.base.Preconditions.checkArgument(ZLjava/lang/String;原因是hive/lib中的gua

overfit同步小助手 2024-05-31 19:03:24 0 收藏

HIVE总结（看完这篇，别说你不会HIVE）

overfit同步小助手 2024-05-31 17:03:59 0 收藏

在虚拟机中进入hive出现ConnectException拒绝连接

如果输入进入hive的命令后出现以下问题。

overfit同步小助手 2024-05-31 13:03:58 0 收藏

如果出现HIveServer2启动异常的解决方法

今天遇到了特别尴尬的事，hadoop集群没启动，今天启动hive的时候HiveServer2一直启动异常，试了好多遍都是这样，当时在网上搜了一下解决问题，有的是没配置hive启动脚本导致启动不成功，想了一下才知道启动hive的时候hadoop集群忘记启动了哈哈。有可能hadoop集群没开，也有可能没

overfit同步小助手 2024-05-31 05:04:04 0 收藏

大数据开发面试题【Hive篇】

吐血整理，小编亲身体验

overfit同步小助手 2024-05-31 00:03:55 0 收藏

大数据Hive中的UDF：自定义数据处理的利器（上）

在大数据技术栈中，扮演着数据仓库的关键角色，它提供了丰富的数据操作功能，并通过类似于SQL的HiveQL语言简化了对Hadoop数据的处理。然而，内置函数库虽强大，却未必能满足所有特定的业务逻辑需求。此时，用户定义函数（UDF）的重要性便凸显出来。Hive UDF）是Hive中的一种扩展机制，它允许

overfit同步小助手 2024-05-30 10:03:52 0 收藏

Hive自定义GenericUDF函数

*** 自定义函数：将字符串转换为大写*//*** 初始化函数* @param arguments 函数参数的ObjectInspector数组* @return 函数返回值的ObjectInspector* @throws UDFArgumentException 如果参数数量不正确*/@Over

overfit同步小助手 2024-05-30 00:03:52 0 收藏

Hive详解（一篇文章让你彻底学会Hive）

最详细的Hive讲解，一篇既可以学会hive的相关知识。

overfit同步小助手 2024-05-29 22:03:57 0 收藏

Hive集合函数 collect_set 和 collect_list 使用示例

在Hive中， collect_set 和 collect_list 是用于收集数据并将其存储为集合的聚合函数。

overfit同步小助手 2024-05-29 14:03:30 0 收藏

Hadoop集群搭建与初步了解Hive

应用： hadoop fs -put /root/1.txt /dir1 #上传文件 hadoop fs –put /root/dir2 / #上传目录。应用: hadoop fs -rm /initial-setup-ks.cfg #删除文件 hadoop fs -rm -r /dir2 #删除目

overfit同步小助手 2024-05-29 12:03:35 0 收藏

hive中如何取交集并集和差集

也可以使用 INTERSECT 关键字。也可以使用 except关键字。

overfit同步小助手 2024-05-29 04:03:38 0 收藏

hive窗口分析函数使用详解系列一

Hive提供的窗口和分析函数可以分为聚合函数类窗口函数，分组排序类窗口函数，偏移量计算类窗口函数

overfit同步小助手 2024-05-29 01:03:52 0 收藏

使用sqoop将mysql数据导入到hive中

这个命令是，将mysql中kk数据库中的表student导入到hive的db_msg数据库的student表（该表可不存在，会自动创建）正常情况下，可以显示所有数据库。

overfit同步小助手 2024-05-28 23:03:42 0 收藏

centos7上安装MySQL并配置Hive

这里的jar包已经在前面下载MySQL的时候已经下载了，这里就移动到下载jar包的目录下进行jar包的解压。1.启动Hadoop的进行，hive是基于Hadoop的来进行搭建的，他的数据时存储在hdfs中的，元数据存储在MySQL中。4. 进入到hive后根据自己的版本选择所要下载的hive版本，这

overfit同步小助手 2024-05-28 18:03:47 0 收藏

任务：将数据传输在Hive（基于hadoop的数据库管理工具）,设置定时任务的各个步骤

平台已经做好基于模板对应的sheet的存储：其中在做好对应关系和字段之后在数据库表也实现了对应表的创建。tip：一般在ods存储实时表，然后在dwd里面存储对应的处理过的宽表（组合起来可能包括很多字段）表有多个字段，每个字段的名称和类型都被列出。... ：定义表的存储格式和I/O格式。：定义表在HD

overfit同步小助手 2024-05-28 14:03:32 0 收藏

Hadoop、HDFS、Hive、Hbase区别及联系

Hadoop、HDFS、Hive和HBase是大数据生态系统中的关键组件，它们都是由Apache软件基金会管理的开源项目。下面将深入解析它们之间的区别和联系。

overfit同步小助手 2024-05-28 09:03:49 0 收藏

hive学习笔记之十一：UDTF(1)

/ 第二列的inspector类型为string型// 第三列的列名// 第三列的inspector类型为string型。

overfit同步小助手 2024-05-28 09:03:32 0 收藏

大数据面试之Hive SQL经典面试题

请注意，这种方法并没有真正地将行转换为独立的列，而是将多个行的值合并到了一个字符串中。在Hive中，由于schema是静态的，将任意数量的行转换为固定数量的列是不直接支持的。如果知道商品ID的最大数量，并且这个数量是固定的，可以使用条件聚合和。然后，在外部查询中，筛选出序列号小于等于 N 的记录，即

overfit同步小助手 2024-05-28 03:03:24 0 收藏

Hive（15）中使用sum() over()实现累积求和和滑动求和

三列数据，分别是员工的姓名、月份和销售额功能：对每个员工的销售业绩的累积求和以及滑动求和（每个月计算其最近三个月的总销售业绩）

overfit同步小助手 2024-05-28 00:03:32 0 收藏