数据仓库 - overfit.cn

hive 的 lateral view用法以及注意事项

1. lateral view 简介 hive函数 lateral view 主要功能是将原本汇总在一条（行）的数据拆分成多条（行）成虚拟表，再与原表进行笛卡尔积，从而得到明细表。配合UDTF函数使用，一般情况下经常与explode函数搭配，explode的操作对象（列值）是 ARRAY 或者 M

overfit同步小助手 2023-02-10 08:04:10 0 收藏

没错，列式存储非常牛。但是，Ta还可以更高效

采用列存可以只读取需要的列，在总列数较多、计算涉及的列较少时，能减少硬盘访问量，提高性能。但仅此还不够，列存数据仓库还要在数据压缩、多线程并行和查找计算等方面做优化以将列存的效果做到最佳。...

overfit同步小助手 2023-02-10 06:04:05 0 收藏

【湖仓一体化】存OR算之争？SPL 我都要

【湖仓一体化】存or算之争？spl我都要什么是湖仓一体？它和数据仓库、数据湖的关系是什么？为什么要用一体来形容呢

overfit同步小助手 2023-02-10 05:04:06 0 收藏

数据湖及湖仓一体化项目学习框架

利用框架的力量，看懂游戏规则，才是入行的前提大多数人不懂，不会，不做，才是你的机会，你得行动，不能畏首畏尾选择才是拉差距关键，风向，比你流的汗水重要一万倍，逆风划船要累死人的上面这些看似没用，但又很重要，这里我就不在详述作用，有兴趣的同学可以看看我的学习框架的重要性我是怎么坚持学习的怎么确定学习目标

overfit同步小助手 2023-02-10 01:04:04 0 收藏

【ClickHouse】-01.万字带你快速入门使用CK

【ClickHouse】-01.万字带你快速入门使用CKClickHouse安装；ClickHouse引擎；ClickHouse数据类型；ClickHouse Sql 案例操作

overfit同步小助手 2023-02-10 00:04:12 0 收藏

Oracle数据库入门教程（作者原创）

oracle数据库快速入门教程，不迷茫

overfit同步小助手 2023-02-04 23:04:09 0 收藏

阿里云-DataWorks- ODPS SQL开发

阿里云数据仓库这一系列断断续续也有很久没有更新了，新年新气象，赶紧赶上开写。ODPS；是由阿里云自主研发，提供针对TB/PB级数据、实时性要求不高的分布式处理能力，应用于数据分析、挖掘、商业智能等领域；阿里巴巴的离线数据业务都运行在ODPS上；

overfit同步小助手 2023-01-22 03:04:11 0 收藏

未来的分析型数据库是什么样的？

十年对于数据库意味着什么？

overfit同步小助手 2023-01-11 08:04:18 0 收藏

数据库实战经验分享（全量表，增量表，拉链表，流水表，快照表）

openGauss数据库实验经验分享

overfit同步小助手 2023-01-08 14:04:13 0 收藏

学生信息管理系统（数据库设计）

学生信息管理系统数据库

overfit同步小助手 2022-12-28 11:04:51 0 收藏

SQL Server安装教程

1，打开SQLserver官网，点击下方Developer版2，点击确定保存文件。3，后选择iso再点击下一步或这你可以更改一下下载位置再点击下一步。4，即下载成功！5，点击：打开文件夹。双击打开下载的光盘映像文件。6，进入之后点击exe应用程序进行安装sqlserver程序。7，选择：硬件和软件要

overfit同步小助手 2022-12-27 20:32:50 0 收藏

阿里云-数据仓库-全链路大数据开发治理平台-DataWorks的数字世界

DataWorks基于MaxCompute、Hologres、EMR、AnalyticDB、CDP等大数据引擎，为数据仓库、数据湖、湖仓一体等解决方案提供统一的全链路大数据开发治理平台。它是数据工场，集成提供对ODPS数据进行加工处理，主要提供了：数据集成、数据开发、数据管理、数据治理、数据分享等

overfit同步小助手 2022-12-24 08:53:05 0 收藏

阿里云-数据仓库-数据分析开发神器-ODPS

ODPS是阿里云自研的一体化大数据计算平台和数据仓库产品，为数字化转型提供多功能、低成本、高性能、稳定、安全、开放和易用的整套产品方案，提供实时离线一体、流批一体、湖仓一体、大数据+AI一体的多场景能力。

overfit同步小助手 2022-12-21 13:05:26 0 收藏

[数据库课程设计]基于Sql Server的教室信息管理系统（附部分源码）

在大学里，教室仍然是教学的主要场所，也是学生学习的重要场所，所以教室环境和设备直接影响到教学活动的开展和学生的学习。为了保证教室环境良好的运转，教室的管理也就显得十分的必要和重要。但是教室的管理也并不是一件很容易的事情。教室的使用具有一定的计划性和流动性，即一个班在相应的时间里，所上的课程和使用的教

overfit同步小助手 2022-12-20 22:18:39 0 收藏

学生信息管理系统（数据库设计）

学生信息管理系统数据库

overfit同步小助手 2022-11-28 12:30:26 0 收藏

Linux安装Redis（详细教程）

Linux安装Redis（详细教程）（服务器）

overfit同步小助手 2022-11-02 13:22:13 0 收藏

SQL Server安装教程

1，打开SQLserver官网，点击下方Developer版2，点击确定保存文件。3，后选择iso再点击下一步或这你可以更改一下下载位置再点击下一步。4，即下载成功！5，点击：打开文件夹。双击打开下载的光盘映像文件。6，进入之后点击exe应用程序进行安装sqlserver程序。7，选择：硬件和软件要

overfit同步小助手 2022-11-02 07:22:22 0 收藏

数据库实战经验分享（全量表，增量表，拉链表，流水表，快照表）

openGauss数据库实验经验分享

overfit同步小助手 2022-11-02 00:21:12 0 收藏

大数据项目之电商数仓、数据仓库概念、项目需求及架构设计

比如用户在电商网站中登录、下单、支付等过程中，需要和网站后台数据库进行增删改查交互，产生的数据就是业务数据。：用户在使用产品过程中，通过埋点收集与客户端产品交互过程中产生的数据，并发往日志服务器进行保存。数据仓库，并不是数据的最终目的地，而是为数据最终的目的地做好准备。这些准备包括对数据的：备份、清

overfit同步小助手 2022-10-23 07:22:12 0 收藏

Hive group by 数据倾斜问题处理

发现一个10.19号的任务下午还没跑完，正常情况下，一般一个小时就已经跑完，而今天已经超过3小时了，因此去观察实际的任务，发现9个map 其中8个已经完成，就一个还在run，说明有明显的数据倾斜。在一小时内结束，并且没有哪个节点耗时较长。发现有使用group by。

overfit同步小助手 2022-10-22 07:23:01 0 收藏

hive 的 lateral view用法以及注意事项

没错，列式存储非常牛。但是，Ta还可以更高效

【湖仓一体化】存OR算之争？SPL 我都要

数据湖及湖仓一体化项目学习框架

【ClickHouse】-01.万字带你快速入门使用CK

Oracle数据库入门教程（作者原创）

阿里云-DataWorks- ODPS SQL开发

未来的分析型数据库是什么样的？

数据库实战经验分享（全量表，增量表，拉链表，流水表，快照表）

学生信息管理系统（数据库设计）

SQL Server安装教程

阿里云-数据仓库-全链路大数据开发治理平台-DataWorks的数字世界

阿里云-数据仓库-数据分析开发神器-ODPS

[数据库课程设计]基于Sql Server的教室信息管理系统（附部分源码）

学生信息管理系统（数据库设计）

Linux安装Redis（详细教程）

SQL Server安装教程

数据库实战经验分享（全量表，增量表，拉链表，流水表，快照表）

大数据项目之电商数仓、数据仓库概念、项目需求及架构设计

Hive group by 数据倾斜问题处理

作者榜

资讯小助手

内容小助手

Deephub

奕凯