大数据 Hive - overfit.cn

[hive] 在hive sql中定义变量

变量可以用于存储和引用常量或表达式的值，以便在查询中重复使用。Hive中的变量是会话级别的，即它们在会话结束后会被重置。在Hive SQL中，可以使用。

overfit同步小助手 2023-12-30 20:03:45 0 收藏

2023.11.16-hive sql高阶函数lateral view,与行转列,列转行

hive函数主要功能是将原本汇总在一条（行）的数据拆分成多条（行）成虚拟表，再与原表进行笛卡尔积，从而得到明细表。配合UDTF函数使用，一般情况下经常与explode函数搭配，explode的操作对象（列值）是ARRAY或者MAP,可以通过split函数将 String 类型的列值转成ARRAY来处

overfit同步小助手 2023-12-30 20:03:15 0 收藏

【Hive】——函数

hive 常见函数，UDF 自定义函数，explode 函数，Lateral view 侧视图，增强聚合函数，窗口函数，

overfit同步小助手 2023-12-29 18:03:40 0 收藏

Hive 浅析

Hive是一个简单的LUA沙盒，除了基本的LUA解释器的功能以外，还提供了诸如热加载等功能。了解HIVE的工作原理有利于了解Lua虚拟机的底层实现机理。本文从是什么-怎么用-为什么三个维度介绍HIVE。

overfit同步小助手 2023-12-29 16:03:35 0 收藏

Hive实战：词频统计

本次实战聚焦于利用Hive在大数据环境下进行词频统计。我们首先在master虚拟机创建文本文件`test.txt`，并将其上传至HDFS作为数据源。接着，启动Hive Metastore服务和客户端，创建外部表`t_word`以读取和处理HDFS中的文本数据。通过精心编写的Hive SQL语句，我们

overfit同步小助手 2023-12-29 16:03:31 0 收藏

hive beeline参数及示例用法

beeline 是一个用于连接 HiveServer2 的命令行工具。

overfit同步小助手 2023-12-29 05:03:14 0 收藏

HIVE 中INSERT INTO 和 INSERT OVERWRITE 的区别，以及OVERWRITE哪些隐藏的坑

HIVE 中INSERT INTO 和 INSERT OVERWRITE 的区别，以及 overwrite 在分区表和非分区表中使用时的注意事项。

overfit同步小助手 2023-12-29 04:03:39 0 收藏

Spark读写Hive

使用Spark读写分布式数据仓库Hive

overfit同步小助手 2023-12-28 19:03:39 0 收藏

hive通过外表整合es，超详细过程。

简单的理解，我们最开始写的地址没有错，但是es这个家伙会发现其他节点的ip，然后用其他ip去连，你这个为true了就只能用我写的那个了。这个不就是kibana的get请求么，我在es试了确实没权限，要组长帮忙开通这个权限后，这个错就解决了。官网的介绍很简单，我看了很多博客，写的也很简单，但是我搞了半

overfit同步小助手 2023-12-27 07:03:44 0 收藏

hive的引擎mapreduce、tez和spark对比

Hive 的执行引擎包括以下几种：Hive 最早使用的执行引擎是基于 Hadoop MapReduce 的。它将 Hive 查询转化为一系列的 MapReduce 任务进行并行执行。MapReduce 引擎适用于处理大规模数据集，具有良好的容错性和扩展性，但由于磁盘读写和中间结果的持久化，可能在性能

overfit同步小助手 2023-12-26 16:03:22 0 收藏

二百一十、Hive——Flume采集的JSON数据文件写入Hive的ODS层表后字段的数据残缺

Flume采集的JSON数据文件写入Hive的ODS层表后字段的数据残缺

overfit同步小助手 2023-12-26 02:03:40 0 收藏

Hive中的常用concat函数——concat函数、concat_ws函数和group_concat函数

overfit同步小助手 2023-12-26 01:03:44 0 收藏

7. Hive解析JSON字符串、JSON数组

说明：将字符串A中符合 java正则表达式B 的部分替换为C。注意，在有些情况下要使用转义字符，类似oracle中的regexp_replace函数。解析出其中的website、name。当我们数据的结构如下，我们想要获取的数据为，

overfit同步小助手 2023-12-25 17:03:44 0 收藏

元数据管理-Atlas的介绍和使用(集成Hive、Solr、Kafka、Kerberos)

概述介绍架构发展架构原理类型系统介绍类型hive_table类型介绍DataSet类型定义Asset类型定义Referenceable类型定义Process类型定义Entities(实体)Attributes(属性)安装安装环境准备安装Solr-7.7.3安装Atlas2.1.0Atlas配置Atl

overfit同步小助手 2023-12-25 07:03:47 0 收藏

【大数据】Hive入门➕安装（尚硅谷大数据Hive 3.1.3教程）

hive尚硅谷面试刷题网站✍命令行客户端beeline是Apache Hive提供的一个交互式工具，用于与Hive进行交互式的数据库操作和查询。具体来说，beeline允许用户通过命令行界面连接到Hive服务器，并在该界面下执行Hive SQL语句、查看查询结果、管理数据库和表等。连接到Hive服务

overfit同步小助手 2023-12-25 04:03:31 0 收藏

HiveServer2 常见异常和处理方法

HiveServer2 常见的3种异常和处理方案

overfit同步小助手 2023-12-25 03:03:48 0 收藏

hive数据库操作,hive函数，FineBI可视化操作

聊天平台每天都会有大量的用户在线，会出现大量的聊天数据，通过对聊天数据的统计分析，可以更好的对用户构建精准的用户画像，为用户提供更好的服务以及实现高ROI的平台运营推广，给公司的发展决策提供精确的数据支撑。我们将基于一个社交平台App的用户数据，完成相关指标的统计分析并结合BI工具对指标进行可视化展

overfit同步小助手 2023-12-25 01:03:46 0 收藏

Hive中处理中文乱码问题的解决方法

如果已经存在的Hive表中包含中文数据，并且出现了乱码问题，可以使用Hive内置的转码函数来处理。综上所述，通过设置Hive的字符集编码、创建表时指定字符集编码和使用转码函数处理中文数据，可以有效地解决Hive中文乱码问题。在实际应用中，根据具体情况选择适合的方法来处理中文数据，以确保数据的正确性和

overfit同步小助手 2023-12-24 22:03:47 0 收藏

【大数据之Hive】六、Hive之metastore服务部署

metastore为Hive CLI或Hiveserver2提供元数据访问接口。

overfit同步小助手 2023-12-24 09:03:38 0 收藏

flink.sql.parser.impl.ParseException

插入操作是通过使用 INSERT INTO 语句来实现的，而不是直接在 SQL 查询中使用转义符号。flink写到hive里面，用不了flink-sql-connector-hive，转义用不了，用单引号' 替换成''在 Flink SQL 的插入语句中，如果要插入包含特殊字符的字符串值，可以使用单

overfit同步小助手 2023-12-24 08:03:49 0 收藏