大数据 Hive - overfit.cn

实际业务读取Hive数据库（2023年2月）

python中hive引擎读数的封装

overfit同步小助手 2023-03-29 23:04:23 0 收藏

HIVESQL的列转行和行转列使用总结

hivesql的行转列以及列转行在实际中的应用

overfit同步小助手 2023-03-29 22:04:56 0 收藏

【Hive】建表时的存储格式

hive建表时的存储格式

overfit同步小助手 2023-03-29 20:05:22 0 收藏

处理hive中hiveserver2启动后，beeline连接出现的“拒绝连接” # 谭子

处理hadoop中hive无法连接hiveserver2问题。Error: Could not open client transport with JDBC Uri: jdbc:hive2://hadoop1:10000User: andy is not allowed to impersonat

overfit同步小助手 2023-03-29 20:04:26 0 收藏

Hive与Hbase的区别与联系

overfit同步小助手 2023-03-29 18:05:16 0 收藏

SQL必知必会（第五版）

SQL必知必会(第五版)快速学习

overfit同步小助手 2023-03-29 16:04:54 0 收藏

大数据集群源数据同步之MySql2HIVE增量同步

纯干货，使用canal+kafka+camus一步一步完成MySQL到hive增量更新的全部详细过程

overfit同步小助手 2023-03-29 15:04:58 0 收藏

关于Hive中的存储格式及压缩格式详解

最近面试，遇到了关于Hive的数据存储格式的问题，回答不尽人意，抽时间总结多看看关于Hive存储格式和压缩格式的内容。TEXTFILE 是 Hive 默认文件存储方式，存储方式为行存储，数据不做压缩，磁盘开销大，数据解析开销大，数据不支持分片，数据加载导入方式可以通过LOAD和INSERT两种方式加

overfit同步小助手 2023-03-29 15:04:44 0 收藏

Hive 删除一个字段

如何删除hive表中的一个字段？

overfit同步小助手 2023-03-29 14:05:05 0 收藏

StreamSets3.14.0安装部署，以及mysql增量采集到hive实战测试

Streamsets mysql增量hive

overfit同步小助手 2023-03-29 14:04:58 0 收藏

大数据就业生就业信息分析可视化

摘要本文利用Hadoop+Hive技术分析就业生毕业后就业信息,对所包含职业、岗位、薪资、所在城市、行业类别等数据信息进行模拟,分析与处理,提取出匹配到的目标数据并将其归类化处理.得出各大城市就业生就业情况数据,为大数据时代应聘人员及高校制定人才培养方案提供数据参考.关键词：就业；就业生；大数据第

overfit同步小助手 2023-03-29 13:05:28 0 收藏

HiveSQL分位数函数percentile()使用详解+实例代码

作为数据分析师每个SQL数据库的函数以及使用技能操作都得点满，尤其是关于统计函数的使用方法。关于统计出数据的中位数，众数和分位数的方法必须掌握几种，一般在实际业务上大部分都是以写SQL查询为主，因为如果想用Python的Pandas去做数据分析还得将数据导出来读出来，输出了结果还得再倒进去，十分的麻

overfit同步小助手 2023-03-29 11:05:30 0 收藏

Hive SQL面试题-流失回流用户数统计

根据用户最后一次登录记录表，统计每天的流失（一段时间未登录平台）用户数量，和回流用户（一段时间未登录平台，但今天重新登录了平台）数量。执行环境：Hive on Spark

overfit同步小助手 2023-03-29 11:04:54 0 收藏

Hive字符串、Json解析

json字符串解析

overfit同步小助手 2023-03-29 10:04:13 0 收藏

hive中get_json_object函数

overfit同步小助手 2023-03-29 09:05:43 0 收藏

大数据之Hive：space函数

1、空格字符串函数：space语法: space(int n)返回值: string说明：返回长度为n的空格字符串举例：hive> select space(10) from dual;hive> select length(space(10)) from dual;102、space函

overfit同步小助手 2023-03-29 09:05:24 0 收藏

HiveServer2 和 HiveMetastore 梳理

从使用者的角度理解这就够了。，也就是说这已经进入到了Hive的内部设计细节了，设计者设计各种重要的业务实体，抽象各种概念，将不同的职责委派给合适的类，所以回到话题本身，Driver类确实是Hiveserver2中的一个核心的类，组织与串联了SQL提交后到转译为MR作业的关键操作，但是从大的架构层面上

overfit同步小助手 2023-03-29 08:04:36 0 收藏

hive窗口函数(开窗函数)

hive开窗函数

overfit同步小助手 2023-03-29 07:05:07 0 收藏

MySQL必知必会

文章目录第一章：数据库基础基本概念什么是SQL第二章：MySQL 简介第三章：了解数据库和表第四章：检索数据SELECT语句第五章：排序检索数据找出一列中最高或最低的值第六章：过滤数据使用WHERE子句WHERE子句操作符第七章：数据过滤第八章：用通配符进行过滤LIKE操作符使用技巧第九章：用正则表

overfit同步小助手 2023-03-29 05:05:18 0 收藏

【Hive 基础】-- 数据倾斜

由于数据分布不均匀，导致大量数据集中到一点，造成数据热点。常见现象：一个 hive sql 有100个 map task，有一个运行了 20分钟，其他99个 task 只运行了 1分钟。

overfit同步小助手 2023-03-29 05:05:08 0 收藏