Hive - overfit.cn

大数据技术之Hive SQL题库-中级

overfit同步小助手 2023-11-27 14:03:51 0 收藏

Hive复杂数据类型(array类型、map类型、struct类型)

一、array类型建表语句：create table 表名(要素1 类型，要素2 类型，要素3 array) row format delimited fileds terminated by '\t' collection items terminated by ',';

overfit同步小助手 2023-11-27 09:03:31 0 收藏

[hive]维度模型分类:星型模型,雪花模型,星座模型|范式

z=f(x,y)当给定x,y则能计算出z,当给x,y,n时，也能计算出z，此时z部分函数依赖于z,y,n。比如通过（学号，课程）推出姓名，因为可以直接通过学号退出姓名，所以：姓名部分依赖于（学号，课程）。星型模型中只有一张事实表，以及0张或多张维度表，事实与纬度表通过主键外键相关联，维度之间不存在关

overfit同步小助手 2023-11-27 01:03:57 0 收藏

hive sql 行列转换开窗函数炸裂函数

讲师表 teacher.csv课程表 course.csv分数表 score.csv员工表 emp.csv雇员表 employee.csv电影表 movie.txt订单表 order.csv创建数据库和数据表行列转换列转行行专列

overfit同步小助手 2023-11-26 21:03:53 0 收藏

Hadoop3.0大数据处理学习1（Haddop介绍、部署、Hive部署）

Hadoop是一个适合海量数据存储与计算的平台。是基于Google的GoogleFS、Map Reduce、BigTable实现的。移动数据：数据 -> 计算程序移动计算：计算程序 -> 数据分布式计算：各个节点局部计算 -> 第二阶段汇总程序官方版本：Apache Hadoop，开源，集群安装维护

overfit同步小助手 2023-11-26 14:03:47 0 收藏

[Hive] 查询结果保存

此外，还可以使用INSERT INTO语句来将查询结果追加到表或分区中，而不是覆盖现有的数据。上述示例将从表table_name中选择满足条件的数据，并将结果以文件的形式覆盖输出到指定的目录/path/to/directory。需要注意的是，使用INSERT OVERWRITE DIRECTORY语

overfit同步小助手 2023-11-26 13:03:14 0 收藏

一百八十八、Hive——HiveSQL查询表中的日期是星期几（亲测，附截图）

HiveSQL查询表中的日期是星期几（亲测，附截图）

overfit同步小助手 2023-11-25 11:03:40 0 收藏

hadoop搭建、mysql、hive部署

大数据基础项目，基于hadoop、mysql、hive实现数据分析

overfit同步小助手 2023-11-25 08:03:52 0 收藏

iceberg学习笔记（2）—— 与Hive集成

本文介绍了iceberg框架如何与hive进行集成

overfit同步小助手 2023-11-25 04:03:32 0 收藏

【Hive进阶】-- 导出 hive 表数据的几种方式

在日常的工作中，常常会有导出 hive 表数据的需求。在此，我整理了如下几种方式，供大家参考。然后使用 hdfs 命令下载。

overfit同步小助手 2023-11-25 04:03:15 0 收藏

Hive内部表（管理表）和外部表的区别【重点】

一、内部表和外部表的区别：内部表和外部表的区别可以从三方面讨论，创建表时、删除表时、选择表时： ...

overfit同步小助手 2023-11-24 05:03:49 0 收藏

第1关：Hive 的 Alter Table 操作

Alter 表/列第1关：Hive 的 Alter Table 操作

overfit同步小助手 2023-11-23 23:03:21 0 收藏

大数据开发之Hive案例篇9-Not yet supported place for UDAF ‘count‘

后面把order by子句注释掉之后，居然就可以了，那么就是order by 后面不能跟聚合函数了。一个很简单的group by和count(*) 操作，然后居然报错了。大概是在Oracle MySQL上写SQL写习惯了，以为可以这么写。于是使用了聚合函数的别名，问题搞定。出了问题也是不知道从何排查

overfit同步小助手 2023-11-23 15:03:26 0 收藏

hive on spark集群环境部署（彻底摆脱做毕设没环境）

hive on spark环境部署

overfit同步小助手 2023-11-23 00:03:45 0 收藏

基于Kylin的数据统计分析平台架构设计与实现

前言此项目是我在TP-LINK公司云平台部门做的一个项目，总体包括云上数据自动化统计流程的设计和组件的开发。目的是为了对云平台上的设备和用户数据做多维度的统计和分析，以及便于观察设备数据的历史趋势，让业务部门更好地做业务决策。整体的架构与数据流向如下图所示，采用Hive做数据仓库，使用Spark实现

overfit同步小助手 2023-11-22 18:03:51 0 收藏

hive sql 拆解字段

在Hive SQL中，拆解字段通常涉及到字符串操作，如将一个包含多个部分的字符串拆解成多个独立的字段。2. SPLIT(str, delimiter)：使用SPLIT函数可以根据指定的分隔符将字符串拆分为一个数组，这对于将含有多个值的字符串拆分成独立的字段非常有用。你可以指定起始位置和要提取的长度。

overfit同步小助手 2023-11-22 16:03:37 0 收藏

2023.11.10 hadoop,hive框架概念,基础组件

任务:1.确认hadoop,hive环境搭建完成2.确认能使用hadoop,hive启动服务的命令,datagrip连接hive服务操作3.背诵/流畅表达 hadoop的架构,各组件之间的关系4.说明hive的流程,元数据的概念。

overfit同步小助手 2023-11-22 12:03:28 0 收藏

在 Flutter 中使用 Hive 的终极指南 Hive：适用于 Flutter 应用程序的完美本地数据库

Hive for Flutter：快速轻量级本地数据库Hive 是用于 Flutter 和 Dart 应用程序的快速轻量级键值数据库。这是在本地存储少量数据的绝佳选择，例如用户偏好、游戏分数或购物车。对于需要能够离线工作的应用程序，Hive 也是一个不错的选择。

overfit同步小助手 2023-11-21 22:03:30 0 收藏

HIVE基本查询操作（二）——第3关：Hive抽样查询

为了完成本关任务，你需要掌握：1.随机抽样 2.桶表抽样 3.数据块抽样。采用对列值哈希，然后除以桶的个数求余的方式决定该条记录存放在哪个桶当中。可以进一步组织成桶，也就是说桶是更为细粒度的数据范围划分。根据提示，在右侧编辑器补充代码，计算每个股票每天的交易量。语句可以获得同样的效果，但是性能没这

overfit同步小助手 2023-11-21 14:03:54 0 收藏

2023.11-9 hive数据仓库,概念,架构,元数据管理模式

当然，这个低是有条件的，即数据规模较小，当数据规模大到超过数据库的处理能力的时候，Hive 的并行计算显然能体现出优势。数据库可以用在 Online 的应用中，但是 Hive 是为数据仓库而设计的，清楚这一点，有助于从应用角度理解 Hive 的特性。由于 Hive 是针对数据仓库应用设计的，而数据仓

overfit同步小助手 2023-11-21 09:03:45 0 收藏