数据仓库 - overfit.cn

Hive 浅析

Hive是一个简单的LUA沙盒，除了基本的LUA解释器的功能以外，还提供了诸如热加载等功能。了解HIVE的工作原理有利于了解Lua虚拟机的底层实现机理。本文从是什么-怎么用-为什么三个维度介绍HIVE。

overfit同步小助手 2023-12-29 16:03:35 0 收藏

广州Y行信用卡中心大数据部数据开发岗笔试题

- 未排序，直接提取原表逻辑结构前10条记录。B.S.S#=SC.S# AND C.C#=SC.C# AND S.SEX IN '男' AND C.CNAME IN '数据库';A.S.S#=SC.S# AND C.C#=SC.C# AND S.SEX='男' AND C.CNAME='数据库';注

overfit同步小助手 2023-12-29 10:03:47 0 收藏

HIVE 中INSERT INTO 和 INSERT OVERWRITE 的区别，以及OVERWRITE哪些隐藏的坑

HIVE 中INSERT INTO 和 INSERT OVERWRITE 的区别，以及 overwrite 在分区表和非分区表中使用时的注意事项。

overfit同步小助手 2023-12-29 04:03:39 0 收藏

阿里云实时数据仓库Hologres&Flink

为企业所有决策制定过程，提供所有系统数据支持的战略集合。传统的离线数仓无法实现当天数据的及时分析数据，所以需要开发实时数仓开填补空缺。

overfit同步小助手 2023-12-28 20:03:14 0 收藏

Hive中的常用concat函数——concat函数、concat_ws函数和group_concat函数

overfit同步小助手 2023-12-26 01:03:44 0 收藏

Hive中处理中文乱码问题的解决方法

如果已经存在的Hive表中包含中文数据，并且出现了乱码问题，可以使用Hive内置的转码函数来处理。综上所述，通过设置Hive的字符集编码、创建表时指定字符集编码和使用转码函数处理中文数据，可以有效地解决Hive中文乱码问题。在实际应用中，根据具体情况选择适合的方法来处理中文数据，以确保数据的正确性和

overfit同步小助手 2023-12-24 22:03:47 0 收藏

Hive 定义变量变量赋值引用变量

hive --define slogan=勿忘国耻set hivevar:slogan=铭记历史;

overfit同步小助手 2023-12-23 20:03:39 0 收藏

Hive case when 用法详细介绍

在上面的示例中，如果客户的收入大于100,000，则他们被分为“高”收入。如果他们的收入在50,000和100,000之间，则被归类为“中等”收入。在此示例中，如果年龄小于18岁，则将用户归类为“未成年”；例如，假设我们有一个包含客户信息的表，我们想根据客户的收入水平将其分类为高收入，中等收入和低收

overfit同步小助手 2023-12-23 16:03:41 0 收藏

数据仓库整理

包括了数据域划分和构建总线矩阵，数据域就是指将业务过程或者维度进行抽象的集合，在划分数据域的时候，应该尽可能保证当前划分的能够覆盖所有的业务需求，又能在新业务进入时无影响的被包含到已有的数据域中或者扩展新的数据域，国际化数仓里面的数据域包括司机域，乘客域，交易域，客服域，安全域等等，阿里巴巴就会有

overfit同步小助手 2023-12-23 10:03:58 0 收藏

【大数据】Doris 构建实时数仓落地方案详解（一）：实时数据仓库概述

数据仓库的概念可以追溯到 20 世纪 80 年代，当时 IBM 的研究人员提出了商业数据仓库的概念。数据仓库概念的提出，是为了解决和数据流相关的各种问题，特别是多重数据复制带来的高成本问题。

overfit同步小助手 2023-12-21 16:03:30 0 收藏

DataGrip连接hive教程

虽然hive官方提供了两种的客户端，但是页面不友好、智能程度低，因此我们往往使用能够提供良好图形页面的第三方客户端。

overfit同步小助手 2023-12-20 11:03:40 0 收藏

Hive增强的聚合、多维数据集、分组和汇总

在多维分析场景下，我们可能会用到高阶聚合函数，例如CUBEROLLUP等。Hive、Spark、Presto等引擎都提供类似的高阶聚合函数，以对不同维度组合下的数据进行聚合统计Hive官方将这种分析称为GROUP BY子句增强的聚合、多维数据集、分组和汇总那么什么是增强聚合和多维分析呢？增强聚合是指

overfit同步小助手 2023-12-18 03:03:52 0 收藏

【大数据】Doris 构建实时数仓落地方案详解（二）：Doris 核心功能解读

Apache Doris 是由百度研发并开源的数据库项目。 Doris 2008 年开始在百度内部立项，经历了五个大版本的迭代后于 2017 年开源，2018 年进入 Apache 基金会孵化项目。2022 年 4 月 18 日正式发布 Doris 1.0，2022 年 6 月 16 日正式毕业，成

overfit同步小助手 2023-12-18 01:03:28 0 收藏

MySQL 图书管理系统

图书管理系统，通过我们在借书还书的过程中，对数据库进行一系列操作

overfit同步小助手 2023-12-17 23:01:59 0 收藏

ERP数据仓库模型

通过对主题域和实体的确定，可以更好地组织数据仓库中的数据，并为后续的数据分析和决策提供支持。通过对用户进行培训和知识转移，可以让用户更好地了解和使用数据仓库中的数据，同时也可以提高用户的工作效率和质量。根据企业的业务需求和目标，可以确定数据仓库的体系结构，包括数据的分层、数据模型的设计、ETL流程等

overfit同步小助手 2023-12-17 20:03:51 0 收藏

Hive 查询优化

set hive.exec.mode.local.auto=true;set mapperd.job.tracker=local;set mapreduce.framework.name=local;set hive.vectorized.execution.enabled=true;

overfit同步小助手 2023-12-17 02:03:54 0 收藏

hive文件存储格式orc和parquet详解

hive orc parquet

overfit同步小助手 2023-12-16 19:03:24 0 收藏

Hive之建表的三种方式

执行的结果是table1 的表与table2的表结构是一致的，但是table1表中的数据为空；Hive建表方式统计了常见的三种建表，分别为直接命令行建表，like建表和as建表。将查询的table2表中id=1的结果插入到table1;或者使用as建表，但表结构会与原表不一致，具体往下看；#原理：直

overfit同步小助手 2023-12-16 17:03:50 0 收藏

mongodb数据同步到hive

通过 datax 从 mongodb 同步数据到 hive

overfit同步小助手 2023-12-16 16:03:49 0 收藏

【Hive-小文件合并】Hive外部分区表利用Insert overwrite的暴力方式进行小文件合并

overfit同步小助手 2023-12-16 08:03:31 0 收藏