Hive - overfit.cn

Hive架构图

hive1

overfit同步小助手 2023-09-03 06:04:21 0 收藏

hive窗口函数计算累加值

rows是物理窗口，是哪一行就是哪一行，与当前行的值（order by key的key的值）无关，只与排序后的行号相关，就是我们常规理解的那样。range是逻辑窗口，与当前行的值有关（order by key的key的值）,在key上操作range范围。简要：如果当前行的值有重复的，range会默认

overfit同步小助手 2023-09-02 03:04:10 0 收藏

CDH6.3.2搭建HIVE ON TEZ

如果内存不够：可以修改如下参数设置。----配置hive运行引擎。

overfit同步小助手 2023-09-01 20:04:29 0 收藏

【Hive实战】Hive的事务表

Hive 事务表简介

overfit同步小助手 2023-08-31 05:04:13 0 收藏

SQL之优化篇：一文搞懂如何优化线上任务性能，增效降本！

可以通过调整split size来设置task的实例数。

overfit同步小助手 2023-08-30 18:02:55 0 收藏

Servlet简介

servlet是一个运行在服务器端的小程序，也是一个接口，介绍了Java类被tomcat识别的规则。

overfit同步小助手 2023-08-30 16:16:41 0 收藏

修复hive重命名分区后新分区为0的问题

ods_t_test 的2022-11-21分区大小为0。hive分区重命名后，新的分区的分区大小为0 ,

overfit同步小助手 2023-08-30 16:06:04 0 收藏

关于hive sql进行调优的理解

这是一个面试经常面的问题，很不幸，在没有准备的时候，我面到了这个题目，反思了下，将这部分的内容进行总结，给大家一点分享。hive其实是基于hadoop的数据库管理工具，底层是基于MapReduce实现的，用户写的hivesql最终转换成MapReduce的任务运行在hadoop上，不过MapRedu

overfit同步小助手 2023-08-30 16:04:41 0 收藏

hive lateral view 实践记录（Array和Map数据类型）

-------最开始错误的插入数据法-------2.array类型的数据，怎么根据下标获取里面的值？1.array类型数据，建表时怎么插入？比原表数据少了双引号。

overfit同步小助手 2023-08-30 16:04:17 0 收藏

hive get_json_object解析json结果为null咋办？

最近一位开发的同学在使用get_json_object函数对json数据解析的时候，出现了结果为null的问题，问题原因是sql语法导致的，那么今天就来详细介绍一下解析json函数的用法！最后还是提醒小伙伴们，在开发过程中，一定要注意sql语法格式的书写，避免一些意想不到的结果！

overfit同步小助手 2023-08-30 07:04:07 0 收藏

HIve中count（1），count（*），count（字段名）三种统计的区别

overfit同步小助手 2023-08-29 21:04:23 0 收藏

hive数据的导入导出

1. TextFile：使用TextFile格式存储的表将数据以文本文件的形式进行存储。这是最常用的默认存储格式。2. SequenceFile：使用SequenceFile格式存储的表将数据以键-值对的形式存储，适用于数据压缩和高效读取。3. ORC（Optimized Row Colum

overfit同步小助手 2023-08-29 12:04:30 0 收藏

Python连接Hive实例教程

1 经在网络查询相关的教程，发现有好多的方式，发现连接底层用的的驱动基本都是pyhive和pyhs2两种第三方库的来连接的 hive,下面将简介连接hive的驱动程序方式，开发工具：pycharm ，经过测试已成功，分享给大家，有什么问题，可私信与我。

overfit同步小助手 2023-08-29 11:04:12 0 收藏

Hive概述

UDF当 Hive 提供的内置函数无法满足你的业务处理需要时，此时就可以考虑使用用户自定义函数（UDF：user-defined function）。TRANSFORM,andUDFandUDAFUDF：就是做一个mapper，对每一条输入数据，映射为一条输出数据。UDAF:就是一个reducer，

overfit同步小助手 2023-08-29 01:04:14 0 收藏

seatunnel-2.3.2 doris数据同步到hive(cdh-6.3.2)首次运行踩坑记录

java.lang.NoClassDefFoundError: org/apache/hadoop/hive/metastore/api/MetaException2、java.lang.NoClassDefFoundError: org/apache/thrift/TBase3、java.lang

overfit同步小助手 2023-08-28 17:03:50 0 收藏

SQL中日期格式处理

实际工作，使用SQL语句对数据进行处理，有一大部分工作是对日期时间型数据进行处理，通过对字段的拼接或转换生成实际需要的格式的日期字段。本文章尽可能全面记录现在主流的数据库（MySQL和Hive）对日期格式的处理，形成一份工作速查文档，提升工作效率。

overfit同步小助手 2023-08-28 04:02:45 0 收藏

“实时数仓”到底是什么？

那么实时数仓的出现也为这些行业打开了一个新的一种业务的发展的可能性。那么我们现在也看到，有更多的一些数据他们是没有严格按照我们的数据建模的，或者说他们是非常零散的，散落在各处的，非常的多模，存在不同的这种数据存储形式的这样一些数据。那么今天我们谈到的实时数据仓库实际上就是从另外一个角度去谈，对我们数

overfit同步小助手 2023-08-27 01:04:27 0 收藏

Seatunnel实战：hive_to_starrocks

本篇文章带大家了解使用Seatunnel将Hive中的数据导入到StarRocks中。

overfit同步小助手 2023-08-26 12:04:19 0 收藏

按分隔符分割字符串（DB2/mysql/hive/Oracle）

数据开发常用：SQL按分隔符分割字段

overfit同步小助手 2023-08-25 18:04:01 0 收藏

SQL使用技巧(4.1)Hive日期时间函数

日期时间函数的使用，主要是Hive和greenplum大数据中的日期时间函数

overfit同步小助手 2023-08-25 10:03:48 0 收藏