Hive - overfit.cn

Python操作Hive数据仓库

sasl模块是Python中用于实现SASL（Simple Authentication and Security Layer）认证的第三方库，提供了对各种SASL机制的支持，例如与Kafka、Hadoop等进行安全通信。Thrift是一个轻量级、跨语言的RPC框架，主要用于服务间的RPC通信。由于

overfit同步小助手 2024-01-05 07:03:39 0 收藏

HIVE窗口函数

开窗函数笔记

overfit同步小助手 2024-01-05 06:03:45 0 收藏

用户行为分析遇到的问题-ubantu16,hadoop3.1.3

ubantu16，hadoop3.1.3做用户行为分析时候遇到的问题

overfit同步小助手 2024-01-05 06:03:42 0 收藏

查看hive表储存在hdfs的哪个目录下

查看hive表储存在hdfs的哪个目录下, 查看一个HDFS目录占用了多少磁盘空间

overfit同步小助手 2024-01-05 04:03:42 0 收藏

解决hive建表中文乱码问题

当hive建表字段注释中出现中文乱码时，可能是因为字符集编码不匹配所导致的。我们可以在建表语句中指定字符集编码来解决这个问题。参数，来指定字符集编码为 UTF-8。参数，来指定字符集编码为 UTF-8。这个参数可用于指定各种 CLI 输出数据的字符集编码，例如控制台输出、日志和报告等。需要注意的是，

overfit同步小助手 2024-01-04 08:03:33 0 收藏

hive怎么更新数据

使用INSERT OVERWRITE语句时，首先需要创建一个临时表，将需要更新的数据插入到临时表中，然后使用INSERT OVERWRITE将临时表的数据覆盖到原始表中。使用哪种方法取决于你的需求和数据更新的逻辑。请注意，在Hive中不能直接更新单个记录，而是通过覆盖或插入来更新整个表或部分数据。要

overfit同步小助手 2024-01-04 03:03:46 0 收藏

Spark学习（8）-SparkSQL的运行流程，Spark On Hive

将Filter这种可以减少数据集的操作下推，放在Scan的位置，这样可以减少操作时候的数据量。RDD的运行会完全按照开发者的代码执行，如果开发者水平有限，RDD的执行效率也会受到影响。当使用ThriftServer后，相当于是一个持续性的Spark On Hive集成模式，它提供10000端口，持

overfit同步小助手 2024-01-03 19:03:35 0 收藏

HIVE运行卡死没反应的亲测解法

这是一个解决hive操作卡住的方案，希望可以帮到遇到相同问题的同学In order to change the average load for a reducer (in bytes): set hive.exec.reducers.bytes.per.reducer=In order to li

overfit同步小助手 2024-01-03 08:03:10 0 收藏

惊!-hive on spark(hive任务)任务慢---竟然有这些原因！

hive性能慢的排查过程，hive on spark 任务慢

overfit同步小助手 2024-01-03 05:03:46 0 收藏

hive合并查询——头歌

之前的单表查询只是对一张表进行查询，而多表查询需要将两张及两张以上的表进行关联查询。在多表查询中，通常使用表名.列名来对各表中的列进行查询操作。的单表查询，本关主要讲解如何进行多表查询。本关任务：统计查询各班学习Python的人数。根据提示，在右侧编辑器补充代码，统计查询各班学习Python的人

overfit同步小助手 2024-01-03 05:03:24 0 收藏

云计算复习之Hive数据仓库期末复习整理

首先，hive是一个构建于hadoop集群之上的数据仓库应用。那么，得先了解一下什么是数据仓库？数据仓库是一个数据集合，用于支持管理决策。简单来说就是为了分析数据而设计的仓库。那么hive就好理解了，hive是一个翻译器，不具备计算能力，存储能力，是一个构建于hadoop集群之上的系统，用于存储和处

overfit同步小助手 2024-01-02 13:03:26 0 收藏

SpringBoot 3 集成Hive 3

造成此问题的原因是:spring boot 默认日志为logback, 而引用的hive-jdbc 及其关联jar 使用的日志为 log4j ，造成SLF4J 绑定冲突。我这边编写一个简单的Controller，打印Hive 默认数据库包含数据库名称。造成此类问题的原因：hiveserver2 服

overfit同步小助手 2024-01-01 10:03:51 0 收藏

Hive调优之小表Join大表

结果：这样的后果就是所有为null值的id全部都变成了相同的字符串“hive”，及其容易造成数据的倾斜（所有的key相同，相同key的数据会到同一个reduce当中去）为了解决这种情况，我们可以通过hive的rand函数，随记的给每一个为空的id赋上一个随机值，这样就不会造成数据倾斜。有时虽然某个

overfit同步小助手 2023-12-31 16:03:40 0 收藏

【Hive】——函数案例

hive 函数案例

overfit同步小助手 2023-12-30 20:03:49 0 收藏

[hive] 在hive sql中定义变量

变量可以用于存储和引用常量或表达式的值，以便在查询中重复使用。Hive中的变量是会话级别的，即它们在会话结束后会被重置。在Hive SQL中，可以使用。

overfit同步小助手 2023-12-30 20:03:45 0 收藏

2023.11.16-hive sql高阶函数lateral view,与行转列,列转行

hive函数主要功能是将原本汇总在一条（行）的数据拆分成多条（行）成虚拟表，再与原表进行笛卡尔积，从而得到明细表。配合UDTF函数使用，一般情况下经常与explode函数搭配，explode的操作对象（列值）是ARRAY或者MAP,可以通过split函数将 String 类型的列值转成ARRAY来处

overfit同步小助手 2023-12-30 20:03:15 0 收藏

【Hive】——函数

hive 常见函数，UDF 自定义函数，explode 函数，Lateral view 侧视图，增强聚合函数，窗口函数，

overfit同步小助手 2023-12-29 18:03:40 0 收藏

Hive 浅析

Hive是一个简单的LUA沙盒，除了基本的LUA解释器的功能以外，还提供了诸如热加载等功能。了解HIVE的工作原理有利于了解Lua虚拟机的底层实现机理。本文从是什么-怎么用-为什么三个维度介绍HIVE。

overfit同步小助手 2023-12-29 16:03:35 0 收藏

Hive实战：词频统计

本次实战聚焦于利用Hive在大数据环境下进行词频统计。我们首先在master虚拟机创建文本文件`test.txt`，并将其上传至HDFS作为数据源。接着，启动Hive Metastore服务和客户端，创建外部表`t_word`以读取和处理HDFS中的文本数据。通过精心编写的Hive SQL语句，我们

overfit同步小助手 2023-12-29 16:03:31 0 收藏

hive beeline参数及示例用法

beeline 是一个用于连接 HiveServer2 的命令行工具。

overfit同步小助手 2023-12-29 05:03:14 0 收藏