大数据 Hive - overfit.cn

一百零一、Kettle——Kettle8.2.0本地连接Hive3.1.2(踩坑，亲测有效)

Kettle8.2.0连接Hive3.1.2

overfit同步小助手 2023-11-06 22:03:41 0 收藏

数据清洗【大数据比赛长期更新】

大数据比赛数据清洗题目分析，欢迎一起讨论

overfit同步小助手 2023-11-06 15:03:46 0 收藏

Hadoop-HA-Hive-on-Spark 4台虚拟机安装配置文件

spark-history（设置权限777），spark-jars文件夹。ln -s 源文件名新文件名。ln -s 源文件名新文件名。ln -s 源文件名新文件名。链接hadoop中的文件。链接hadoop中的文件。上传jar到hdfs。链接hive中的文件。

overfit同步小助手 2023-11-06 08:03:37 0 收藏

API网关与社保模块

overfit同步小助手 2023-11-05 03:03:17 0 收藏

hive lag() 和lead（）函数

Hive 中的LAG和LEAD函数时，通常用于在结果集中获取同一列在前一行（LAG）或后一行（LEAD）的值。这在分析时间序列数据、计算变化率或查找趋势时非常有用。LAG函数用于获取前一行的值。

overfit同步小助手 2023-11-04 02:03:48 0 收藏

大数据学习(6)-hive底层原理Mapreduce

在Reduce阶段，不同的Map任务输出的键值对通过Shuffle机制进行分区和排序，相同key的数据value放在一个集合中。然后，对每个key对应的value集合进行归约处理，即执行Reduce函数。在Map阶段，MapTask并行度决定机制根据InputFormat数据切片机制对输入数据进行切

overfit同步小助手 2023-11-02 14:03:42 0 收藏

头歌educoder Hive自定义函数

自定义函数就是除了系统提供给你的函数，你自己去定义的函数。我们需要设置函数的作用、参数、返回值，然而Hive中支持的常见自定义函数有三种，分别是UDF、UDAF、UDTF。

overfit同步小助手 2023-11-02 03:03:31 0 收藏

MySQL到TiDB：Hive Metastore横向扩展之路

本文介绍了vivo在大数据元数据服务横向扩展道路上的探索历程，由实际面临的问题出发，对当前主流的横向扩展方案进行了调研及对比测试，通过多方面对比数据择优选择TiDB方案。其次分享了整个扩展方案流程、实施遇到的问题及解决方案，对于在大数据元数据性能上面临同样困境的开发者本篇文章具有非常高的参考借鉴价值

overfit同步小助手 2023-11-01 06:03:54 0 收藏

Windows下DataGrip连接Hive

单独开一个窗口先开启这个元数据服务，这个服务是上面操作了hive后，hive又会通过操作元数据的方式操作mysql。单独开一个窗口启动hiveserver2服务，这个服务是beeline连接的，提供jdbc协议帮助操作hive的。

overfit同步小助手 2023-10-31 22:03:45 0 收藏

Hive篇面试题+详解

Hive是一个基于Hadoop的数据仓库工具，它提供了一个类SQL的查询语言（HiveQL）来查询和分析存储在Hadoop集群中的大规模数据。Hive的主要功能是将结构化数据映射到Hadoop的分布式文件系统（HDFS）上，并提供高级查询和分析功能。Hive支持多种存储格式，包括文本文件、序列文件、

overfit同步小助手 2023-10-31 03:03:26 0 收藏

docker 安装hive

想练练Hive SQL，但是没有hive shell环境。现在只有一台空的CentOS 7机子，一想要弄jdk、hadoop、mysql、hive就头疼。于是在网上找了找，发现用docker部署hive会快很多，在此记录一下部署过程。以下过程每一步在文末都附有参考文档，出错的朋友可以去看对应的参考文

overfit同步小助手 2023-10-31 01:03:37 0 收藏

Java通过kerberos权限认证集成hive

java通过kerberos权限认证集成hive，并操作hive实现hive库和表、分区表的增删查等功能

overfit同步小助手 2023-10-31 00:03:32 0 收藏

Hive引擎MR、Tez、Spark

不更换引擎hive默认的就是MR。：是一种编程模型，用于大规模数据集（大于1TB）的并行运算。：Hive既作为存储元数据又负责SQL的解析优化，语法是HQL语法，执行引擎变成了Spark，Spark负责采用RDD执行。

overfit同步小助手 2023-10-30 13:03:26 0 收藏

hive 之select 中文乱码

concat_ws("",arrary("境内")) 有用，此时也不知道如何下手，只有掏出大杀器 explain.其实还有别的办法，但是和concat_ws(array(""))一样比较丑陋，我就不说了。经过多方面测试 concat("境内") concat_ws("","境内")没用，有时候我们需

overfit同步小助手 2023-10-30 08:03:53 0 收藏

[Hive] 常见函数

REGEXP_REPLACE(string, pattern, replacement)：使用正则表达式模式替换字符串中的匹配项为指定的替换字符串。JSON_EXTTRACT(json_string, json_path)：从 JSON 字符串中提取满足 JSONPath 表达式的值。GET_JSO

overfit同步小助手 2023-10-29 15:03:42 0 收藏

数据仓库Hive（林子雨课程慕课）

Hive特点传统的数据仓库既是数据存储产品也是数据分析产品传统的数据仓库能同时支持数据的存储和处理分析Hive本身并不支持数据存储和处理其实只是提供了一种编程语言其架构于Hadoop之上，Hadoop有支持大规模数据存储的组件HDFS，以及支持大规模数据处理的组件MapReduceHive借助于这两

overfit同步小助手 2023-10-29 04:03:44 0 收藏

Hive【Hive（三）查询语句】

Hive 查询语句、基本查询、分组、排序、join

overfit同步小助手 2023-10-28 17:03:17 0 收藏

Hive解析Json数组超全讲解

在Hive中会有很多数据是用Json格式来存储的，如开发人员对APP上的页面进行埋点时，会将多个字段存放在一个json数组中，因此数据平台调用数据时，要对埋点数据进行解析。接下来就聊聊Hive中是如何解析json数据的。结果：namezhangsan如果既要解析name字段，也解析age字段，则可以

overfit同步小助手 2023-10-27 09:03:36 0 收藏

hive 如何处理json字符串

hive处理json字符串以及json数组

overfit同步小助手 2023-10-27 02:03:51 0 收藏

MySQL中的业务数据该如何正确导入到Hive中 - Sqoop

业务系统中的数据如何导入到HDFS系统中，并加载到Hive数仓中

overfit同步小助手 2023-10-25 18:03:42 0 收藏