数据仓库 - overfit.cn

Hive 判断某个字段长度

Hive内置函数是Hive提供的一组函数，用于在Hive SQL查询中进行数据处理、转换和分析。这些函数可以帮助用户更高效地处理数据，实现复杂的数据操作和计算。然后，通过Hive SQL查询语句筛选出了用户名长度大于等于5并且小于等于10的用户数据，以实现对用户数据的精确筛选。在Hive中，有时我们

overfit同步小助手 2024-09-21 04:03:48 0 收藏

数据库系统第17节数据仓库案例赏析

下面我将通过几个具体的案例来说明数据仓库如何在不同的行业中发挥作用，并解决实际业务问题。

overfit同步小助手 2024-09-20 21:03:57 0 收藏

从 7000 余项目脱颖而出，飞轮科技《新一代实时分析数据仓库解决方案》荣获 HICOOL 2024 全球创业大赛二等奖

HICOOL 2024 全球创业者峰会于 2024 年 8 月 23 日 -25 日在中国国际展览中心（顺义馆）成功举行，峰会以“新质引领创新共融”为主题，聚焦技术创新、产业融合、新质共享与国际合作四大要素。在 8 月 23 日晚的峰会开幕式上，举行 HICOOL 2024 全球创业大赛颁奖盛典

overfit同步小助手 2024-09-20 19:03:34 0 收藏

数据仓库系列 1：什么是数据仓库,它与传统数据库有什么不同?

数据仓库(Data Warehouse)是一个面向主题的、集成的、相对稳定的、反映历史变化的数据集合,用于支持管理决策。这个定义来自被誉为"数据仓库之父"的Bill Inmon。但这个定义可能对初学者来说有点抽象,让我们通过一个类比来更好地理解它:想象你是一家大型超市的经理。每天,你的超市都会产生大

overfit同步小助手 2024-09-20 11:04:00 0 收藏

day05-Hive语法补充

表名和字段的修改使用alter关键字。

overfit同步小助手 2024-09-20 04:03:25 0 收藏

拉链表和宽表的优劣势

是一种用于数据仓库的表结构，记录了数据随时间变化的历史状态。每次数据发生变化时，都会在拉链表中插入一条新记录，而旧记录保持不变，仅标记其有效时间区间。

overfit同步小助手 2024-09-20 01:03:52 0 收藏

从数据仓库到数据中台再到数据飞轮：社交媒体的数据技术进化史

大家好，我是在大数据方面具有一定理解的博主。今天我想分享下从数据仓库到数据中台再到数据飞轮:社交媒体的数据技术进化史，也是这篇文章主题。我亲眼目睹了社交媒体的快速发展，以及随之而来的海量数据的生成与积累。如何有效地管理和利用这些数据，已经成为各大平台在竞争中脱颖而出的关键因素。在我看来，随着技术的进

overfit同步小助手 2024-09-19 09:03:17 0 收藏

Hive中的数据类型详解

Hive的数据类型是构建数据表、进行数据分析和查询的基础。了解Hive中各类数据类型的特点、使用场景和选择原则，有助于数据工程师和分析师在设计表结构时作出合理的决策。基本数据类型：包括数字、字符串、布尔、日期和时间类型，适用于存储最基本的数据。复杂数据类型：包括数组、结构体和映射，适用于存储更复杂和

overfit同步小助手 2024-09-19 02:03:47 0 收藏

hive入门

打开：命令提示符程序，输入mysql -uroot -p 回车查看数据库使用数据库use 数据库名称;创建数据库删除数据库查看当前使用的数据库查看当前use的数据库。

overfit同步小助手 2024-09-18 01:03:24 0 收藏

初级练习[1]:Hive数据环境搭建与SQL查询实战

【代码】Hive数据环境搭建与SQL查询实战。

overfit同步小助手 2024-09-14 20:03:49 0 收藏

为数据仓库构建Zero-ETL无缝集成数据分析方案（下篇）

服务之间直接集成，不需要使用额外组件完成数据 ETL 的工作。把各种各样的数据都连接到执行分析所需要的地方，实现数据平滑“无感”的流动。它可以帮助用户最大限度地减少甚至消除构建 ETL 数据管道的复杂性。提高敏捷性。简化了数据架构并减少了数据工程的工作量。它允许增加新的数据源，而无需重新处理大量数据

overfit同步小助手 2024-09-12 14:03:24 0 收藏

HIVE 数据仓库工具之第一部分（讲解&部署）

overfit同步小助手 2024-09-12 04:03:50 0 收藏

为数据仓库构建Zero-ETL无缝集成数据分析方案（上篇）

服务之间直接集成，不需要使用额外组件完成数据 ETL 的工作。把各种各样的数据都连接到执行分析所需要的地方，实现数据平滑“无感”的流动。它可以帮助用户最大限度地减少甚至消除构建 ETL 数据管道的复杂性。提高敏捷性。简化了数据架构并减少了数据工程的工作量。它允许增加新的数据源，而无需重新处理大量数据

overfit同步小助手 2024-09-11 14:03:27 0 收藏

Impala 与 Hive 的比较

Impala 与 Hive 的关系与异同

overfit同步小助手 2024-09-09 20:03:48 0 收藏

Hive的安装

将apache-hive-3.1.2-bin.tar.gz 上传到hadoop102的/opt/software 目录下。解压 apache-hive-3.1.2-bin.tar.gz 到/opt/module/目录下面。修改 apache-hive-3.1.2-bin.tar.gz 的名称为 hi

overfit同步小助手 2024-09-09 03:03:38 0 收藏

数据仓库系列15：数据集成的常见挑战有哪些,如何应对?

数据集成是指将来自不同源的数据统一管理，使之在数据仓库中能够无缝协同工作。它包括从不同的数据源收集数据、清洗数据、转换数据以及加载到数据仓库中的过程（ETL流程：Extract, Transform, Load）。

overfit同步小助手 2024-09-08 12:03:23 0 收藏

数据仓库系列13：增量更新和全量更新有什么区别,如何选择?

今天，让我们深入探讨这个数据仓库领域的核心问题，揭示增量更新和全量更新的秘密，帮助你在实际工作中做出明智的选择。

overfit同步小助手 2024-09-08 10:03:27 0 收藏

hive的first_value、last_value函数，可取非null值

介绍hive函数first_value、last_value用法

overfit同步小助手 2024-09-07 14:03:47 0 收藏

数仓工具—Hive语法之替换函数和示例

rlike regexp 是一样的，都是正则匹配REGEXP_REPLACE 是正则替换REGEXP_REPLACE 是正则提取Translate 是字符替换like 是字符匹配，有自己的语法。

overfit同步小助手 2024-09-06 22:03:33 0 收藏

hive 基本语法

*不会在HDFS对数据库所在目录进行改名，只是修改location后，新创建的表在新的路径，旧的不变**虚拟列是Hive内置的可以在查询语句中使用的特殊标记，可以查询数据本身的详细参数。**分桶表无法使用LOAD DATA进行数据加载****分区所在的HDFS文件夹依旧保留**将其它表数据，加载到目

overfit同步小助手 2024-09-05 08:03:52 0 收藏