Hive简介

ETL:首先从数据源池中提取数据,将数据保存在临时暂存数据库中(ODS),然后执行转换为合适目标数据仓库系统的形式,然后将结构化数据加载到仓库中,已备分析。数据仓库层(DW):数据加工与整合,建立一致性的维度,构建可复用的面向分析和统计的明细事实表,以及汇总公共粒度的指标。操作型数据层(ODS):存

一文掌握SQLite3基本用法

一、基本语法 1.指令 .open filename --打开文件-- 注解.show --显示信息.q --退出.databases --显示数据库.help --帮助.dump --

离线和实时数仓技术架构梳理

对目前流行的离线数仓和实时数仓架构进行了梳理和对比

【SQL开发实战技巧】系列(二十八):数仓报表场景☞人员分布问题以及不同组(分区)同时聚集如何实现

本篇文章讲解的主要内容是:***通过行转列实现人员空间分布问题(工作显示为一列,每位员工显示一行)、连续行转列应该注意的问题、通过执行计划看对不同组、分区同时实现聚集需求:要求在员工表的明细数据里列出员工所在部门及职位的人数!!***【SQL开发实战技巧】这一系列博主当作复习旧知识来进行写作,毕竟S

hive数据仓库课后答案

Hive数据仓库应用课后答案

ETL基础概念及要求详解

ETL即Extract(抽取)Transform(转换)Load(装载)的过程,如下图,同时也包括数据清洗的部分,是数据从源端到目标端的一个数据处理的过程,是构建数据仓库的重要一环,但不局限于构建数据仓库其他BI(商业智能)的设计和开发数据分析平台也经常用到ETL。

Doris 与 ClickHouse 的深度对比

一、背景介绍Apache Doris是由百度贡献的开源MPP分析型数据库产品,亚秒级查询响应时间,支持实时数据分析;分布式架构简洁,易于运维,可以支持10PB以上的超大数据集;可以满足多种数据分析需求,例如固定历史报表,实时数据分析,交互式数据分析和探索式数据分析等。ClickHouse是俄罗斯的搜

离线数仓-伪分布虚拟机 (所有组件部署完成,全流程运行成功)(数仓4.0-2.0,CDH)

尚硅谷数仓虚拟机镜像博主通过学习尚硅谷数仓项目,将部署好的数仓虚拟机打包成ovf文件,由于博主电脑内存较小,博主使用了伪分布式集群搭建,全流程运行成功。分享虚拟机镜像文件给予大家学习。搭建数仓只需一台虚拟机,且最低配置(内存:3G,磁盘:20G,CUP:1,Linux最小化安装)导入镜像的前提设置记

Required field ‘client_protocol‘ is unset 原因探究

最新在做基于Thrift协议的hive客户端,但是遇到了问题,具体一点的异常如下...

头哥数据库实验总结

这里写目录标题实验二第一关:插入数据插入功能格式例题第二关:更新数据(修改数据)修改数据格式更新单个列更新多个列删除列例题字符串拼接concat函数+字符串修改substring函数例题rtrim函数例题第三关:删除数据数据的删除delete函数例题实验三:简单查询第一关 简单查询select函数例

【数据挖掘】恒生金融有限公司2023届秋招数据ETL工程师笔试题解析

恒生金融公司,笔试时间:2022年9月24号,岗位:数据ETL工程师,时间:120分钟。

MySQL8.0详细安装教程,下载,安装,配置,登录测试

MySQL8.0详细安装教程,下载,安装,配置,登录测试

数据清洗是清洗什么?

在搭建数据中台、数据仓库或者做数据分析之前,首要的工作重点就是做数据清洗,否则会影响到后续对数据的分析利用。那么数据清洗到底是做什么事情呢?今天我就来跟大家分享一下。

hive 增加字段 修改注释

hive 增加字段 修改注释

2000-2021年各省GDP包括名义GDP、实际GDP、GDP平减指数(以2000年为基期)

2000-2021年各省GDP包括名义GDP、实际GDP、GDP平减指数(以2000年为基期)

【SQL开发实战技巧】系列(二十一):数据仓库中时间类型操作(进阶)识别重叠的日期范围,按指定10分钟时间间隔汇总数据

如何识别重叠的日期范围、日期出现次数、确定当前记录和下一条记录之间相差的天数【SQL开发实战技巧】这一系列博主当作复习旧知识来进行写作,毕竟SQL开发在数据分析场景非常重要且基础,面试也会经常问SQL开发和调优经验,相信当我写完这一系列文章,也能再有所收获,未来面对SQL面试也能游刃有余~。例如:以

Hive增加列,调整列顺序,属性名等操作

hive添加字段到指定位置先添加字段到最后位置再移动到指定位置

超详细【入门精讲】数据仓库原理&实战 一步一步搭建数据仓库 内附相应实验代码和镜像数据和脚本

超详细【入门精讲】数据仓库原理&实战 一步一步搭建数据仓库 内附相应实验代码和镜像数据和脚本,参考B站up主哈喽鹏程视频撰写而成,感谢!!!

Hive之Map常用方法

实际工作中,有时会出现map复杂数据类型,字段field1形式如:{‘k0’:‘abc’,‘k1’:‘01,02,03’,‘k2’:‘456’},如果是string形式,我们可以适用get_json_object 函数,取出对应的value值,具体如:get_json_object(field,‘$

今天又get到一个小技能,collect_set函数

collect_set函数今天又get到一个小技能,掌握了hive一个关于列转行专用函数 collect_set函数。在这里做个学习笔记。collect_set是Hive内置的一个聚合函数, 结果返回一个消除了重复元素的对象集合, 其返回值类型是 array 。和collect_set相似的还有另一

登录可以使用的更多功能哦! 登录
作者榜
...
资讯小助手

资讯同步

...
内容小助手

文章同步

...
Deephub

公众号:deephub-imba

...
奕凯

公众号:奕凯的技术栈