大数据 Hive - overfit.cn

虽然逻辑上理解并不矛盾，尽管该UDTF返回的是个表，但一行输入只会对应一行输出，只是输出的字段可能是多个，并不像explode那样返回的是多行。和get_json_object不同的是，get_json_object是一个普通的UDF函数，返回的是一个值。，该函数适用于对传入的json对象一次性解析

overfit同步小助手 2024-09-09 15:03:49 0 收藏

一. 从Hive开始

总结，大数据背景下，hdfs看起来想一个无限大的存储空间，mapreduce的思想充分利用所有的cpu和内存。所以hive中的一个核心模块就是metastore，用来存储结构化的信息，也就是“数据的数据”，其实也是借用了传统文件系统的“metaData”（元数据）的概念。是一种特殊的语法，主要搭配

overfit同步小助手 2024-09-09 11:03:51 0 收藏

Python教程：使用 Python 和 PyHive 连接 Hive 数据库

在大数据时代，Hive 提供了一种简便的方式来处理和分析大规模的数据集。本文将通过一个简单的 Python 类 HiveConnectionManager 来展示如何使用 PyHive 库连接到 Hive 数据库，并执行基本的数据库操作。

overfit同步小助手 2024-09-09 06:03:50 0 收藏

Hive的安装

将apache-hive-3.1.2-bin.tar.gz 上传到hadoop102的/opt/software 目录下。解压 apache-hive-3.1.2-bin.tar.gz 到/opt/module/目录下面。修改 apache-hive-3.1.2-bin.tar.gz 的名称为 hi

overfit同步小助手 2024-09-09 03:03:38 0 收藏

datax做增量导入数据到hive:mysql＞hive

datax做增量导入mysql数据到hive

overfit同步小助手 2024-09-08 22:03:51 0 收藏

MapJoin 详细介绍

MapJoin 是大数据处理框架如 Apache Hive 中的一种优化技术, 专门用于提升联接操作 (Join Operation) 的效率;通常在处理海量数据时, 联接操作需要在两张或多张表直接匹配数据行, 这个过程可能会消耗大量的时间和资源;MapJoin 提供了一种优化方案, 通过Map 阶

overfit同步小助手 2024-09-08 14:10:22 0 收藏

大数据：模糊查询LIKE和正则RLIKE，REGEXP

模糊查询LIKE和正则RLIKE，REGEXP

overfit同步小助手 2024-09-07 22:03:43 0 收藏

hive的first_value、last_value函数，可取非null值

介绍hive函数first_value、last_value用法

overfit同步小助手 2024-09-07 14:03:47 0 收藏

插入Hive表数据SQL

Hive是一个建立在Hadoop之上的数据仓库工具，它提供了类似于SQL的语言HiveQL，使用户能够在Hadoop中进行数据分析和查询。在Hive中，表是数据存储和管理的基本单元，用户可以通过表来组织和存储数据。

overfit同步小助手 2024-09-07 09:03:31 0 收藏

数仓工具—Hive语法之替换函数和示例

rlike regexp 是一样的，都是正则匹配REGEXP_REPLACE 是正则替换REGEXP_REPLACE 是正则提取Translate 是字符替换like 是字符匹配，有自己的语法。

overfit同步小助手 2024-09-06 22:03:33 0 收藏

学习大数据DAY41 Hive 分区表创建

索引（相当于应用“看到”的只是一个表或索引），但在物理上这个表或索引可。分区对应用透明，即对访问数据库的应用而言，逻辑上讲只有一个表或一个。注意：如果删除的分区是表中唯一的分区，那么此分区将不能被删除，要想。4 将第二部的数据使用动态分区的方法导入到第三步的表中。分区是将一个表或索引物理地分解

overfit同步小助手 2024-09-06 14:03:32 0 收藏

hive 正则表达式

2024年6月1日公告: 1、“三力转债”到期日和兑付登记日:2024年6月7日(星期五) 2、“三力转债”到期兑付价格:106元/张(含最后一期利息,含税) 3、“三力转债”到期兑付资金发放日:2024年6月11日(星期二) 4、“三力转债”摘牌日:2024年6月11日(星期二) 5、“三力转债”

overfit同步小助手 2024-09-06 09:03:57 0 收藏

Hive SQL 分组与连接操作详解

初级练习[1]:Hive数据环境搭建与SQL查询实战

Hive数据库与表操作全指南

HIVE 数据仓库工具之第一部分（讲解&部署）

如何使用Hive构建网络电视剧收视率分析系统：大数据实战教程

CDH集成Paimon+flink+hive的测试联调

使用es-hadoop同步hive和es之间数据

Impala 与 Hive 的比较

【hive】HiveSQL中两个json解析函数的使用&json路径定位小工具