Hive - overfit.cn

Hive SQL中的列转行（lateral view与explode）、行转列

列转行、行转列的灵活运用

overfit同步小助手 2024-02-29 14:03:52 0 收藏

【JavaEE进阶】拦截器(DispatcherServlet)源码简介

上一篇博客我们使用了拦截器，那么拦截器是如何实现拦截的呢？接下来我们将从源码来看一下是如何实现拦截的。适配器模式,也叫包装器模式.将⼀个类的接⼝，转换成客⼾期望的另⼀个接⼝,适配器让原本接⼝不兼容的类可以合作⽆间.简单来说就是⽬标类不能直接使⽤,通过⼀个新类进⾏包装⼀下,适配调⽤⽅使⽤.把两个不兼容

overfit同步小助手 2024-02-29 09:03:23 0 收藏

CentOS7 Hive2.3.8安装

删空后加入以下内容，注意复制进去的时候不要少了>符号之类的小错误，此文件涉及到之前设置的密码Root123!,如果你不一样，记得改。复制备份hive-default.xml.template并命名为hive-site.xml。在文件最底下加，注意hadoop版本和java版本以及路径是否和我一样，不

overfit同步小助手 2024-02-29 09:03:19 0 收藏

二百二十三、Kettle——从Hive增量导入到ClickHouse(根据day字段判断)

Kettle——从Hive增量导入到ClickHouse(根据day字段判断)

overfit同步小助手 2024-02-28 16:03:43 0 收藏

企业级大数据安全架构（十）DBeaver连接Hive的Kerberos认证配置

因为Kerberos认证过程及集群服务中，很多是以主机名的形式进行访问的，所以工作机要设置hosts. 域名映射，我们通过部署CDH的集群的每一台机器都已经配置了host(文件为/etc/hosts)，工作机也需要配置window的host文件，如果提示无法修改，一般是需要管理员权限的原因，比较简单

overfit同步小助手 2024-02-28 14:03:27 0 收藏

Spark SQL和Hive SQL 的对比

总结来说，Hive SQL更侧重于构建大数据仓库解决方案，而Spark SQL则在保持与Hive兼容的基础上，提升了查询性能并增加了更多高级功能，如支持更丰富的数据源连接、实时处理能力以及与Scala/Java/Python API的高度集成。用户可以根据实际需求选择或结合使用两者来满足不同的数据分

overfit同步小助手 2024-02-28 09:03:38 0 收藏

安装配置hive

正确安装Hive；正确配置Hive，理解其配置原理。

overfit同步小助手 2024-02-28 06:03:22 0 收藏

hive--外部表常用操作全面且详细

在创建表的时候可以指定external关键字创建外部表,外部表对应的文件存储在location指定的hdfs目录下,向该目录添加新文件的同时，该表也会读取到该文件(当然文件格式必须跟表定义的一致)。外部表因为是指定其他的hdfs路径的数据加载到表当中来，所以hive表会认为自己不完全独占这份数据，所

overfit同步小助手 2024-02-28 00:03:24 0 收藏

Hive与Presto中的列转行区别

Hive、Spark和Presto都提供了这种实现，但有所不同。下面通过这个案例介绍三者之间的区别及注意事项。在处理数据时，我们经常会遇到一个字段存储多个值，这时需要把一行数据转换为多行数据，形成标准的结构化数据。不会自动过滤被转换列和转换列字段值为空的数据，因此此方式数据不会丢失。会自动过滤被转换

overfit同步小助手 2024-02-27 15:03:50 0 收藏

Hive实战：计算总分与平均分

本次实战以Hive为核心，针对学生成绩数据进行统计分析。首先，在虚拟机中创建score.txt文件存储五名学生的成绩记录，并上传至HDFS的路径下。接着启动Hive Metastore服务和客户端，创建与成绩表结构对应的内部表t_score，并运用load data命令将HDFS数据导入该表。最后，

overfit同步小助手 2024-02-27 10:03:46 0 收藏

2024.2.10 HCIA - Big Data笔记

MRS提供租户完全可控的一站式企业级大数据集群云服务,完全兼容开源接口,结合华为云计算,存储优势及大数据行业经验,为客户提供高性能,低成本,灵活易用的全栈大数据平台,为客户提供高性能、低成本、灵活易用的全栈大数据平台，轻松运行Hadoop、Spark、HBase、Kafka、Storm等大数据组件，

overfit同步小助手 2024-02-27 05:03:40 0 收藏

flink sql 实战实例及延伸问题：聚合/数据倾斜/DAU/Hive流批一体等

核心问题在于成本过高。甚至可以使用 10 分钟级别的分区策略，使用 Flink 的 Hive streaming source 和 Hive streaming sink ，可以大大提高 Hive 数仓的实时性到准实时分钟级，在实时化的同时，也支持针对 Table 全量的 Ad-hoc 查询，提高灵

overfit同步小助手 2024-02-26 16:03:18 0 收藏

HIVE核心优化方案

目录1.数据采样2.join优化3.Hive索引4.数据倾斜。

overfit同步小助手 2024-02-26 05:03:49 0 收藏

spark3使用hive zstd压缩格式总结

ZSTD（全称为Zstandard）是一种开源的无损数据压缩算法，其压缩性能和压缩比均优于当前Hadoop支持的其他压缩格式，本特性使得Hive支持ZSTD压缩格式的表。Hive支持基于ZSTD压缩的存储格式有常见的ORC，RCFile，TextFile，JsonFile，Parquet，Squen

overfit同步小助手 2024-02-26 02:03:20 0 收藏

hive/sparksql/presto 时区转换和时间类型转换

overfit同步小助手 2024-02-25 18:03:41 0 收藏

删除和清空Hive外部表数据

内部表数据存储的位置是hive.metastore.warehouse.dir（默认：/user/hive/warehouse），外部表数据的存储位置由自己制定（如果没有LOCATION，Hive将在HDFS上的/user/hive/warehouse文件夹下以外部表的表名创建一个文件夹，并将属于这

overfit同步小助手 2024-02-25 18:03:24 0 收藏

Spark On Hive原理和配置

包含Hive、MySQL等安装配置

overfit同步小助手 2024-02-25 17:03:28 0 收藏

如何使用Hive或者HadoopMR访问表格存储中的表

更新时间：2023-12-14 09:58本文主要为您介绍如何使用Hive或者HadoopMR访问表格存储中的表。

overfit同步小助手 2024-02-25 04:03:37 0 收藏

Hive之set参数大全-16

在 Hive 中，是一个参数，用于配置 HiveServer2 的传输模式。该参数定义了 HiveServer2 使用的传输协议，可以是二进制（Binary）或 HTTP。以下是设置其中，是传输模式，可以是binary或http。请注意，这样的设置只对当前 HiveServer2 会话有效，当 Hi

overfit同步小助手 2024-02-25 01:03:46 0 收藏

Hive调优-计算资源分配

有些时候，代码运行速度慢、效率低，可能仅仅是因为资源分配不当。

overfit同步小助手 2024-02-24 22:03:32 0 收藏