大数据数据仓库

Hive实现delete、update操作

【代码】Hive实现delete、update操作。

overfit同步小助手 2024-07-06 13:03:36 0 收藏

hive获取月初1号以及次月1号

-把系统时间减去目前天数的日期转换为时间戳格式。如系统时间：2024123，即为2024123-23=20231231。--4.系统时间减去系统天数--即上月的最后一天:是否要加unix_timestamp还不确定。--转换为时间：2024-01-01 00:00:00。--1.剖析：获取系统时间的

overfit同步小助手 2024-07-05 05:03:15 0 收藏

《数据仓库与数据挖掘》总复习

overfit同步小助手 2024-07-04 13:03:41 0 收藏

JMU 数科数据库与数据仓库期末总结（3）简答题

在这个StudentsStudentID是主键，用于唯一标识每一条学生记录。Name是学生姓名，不能为空。Gender表示性别，用单个字符'M'代表男性，'F'代表女性，通过CHECK约束确保数据的有效性。BirthDate记录学生的出生日期。记录学生入学日期，不能为空。ClassID是一个外键，用

overfit同步小助手 2024-07-02 08:03:31 0 收藏

数据仓库——维度表一致性

一致性矩阵可以作为实现蓝图，指明了所有事实表连接的位置，这允许独立地实现每一个事实表，并能可信地与那些已经存在的事实表协同工作。更好的描述一致性维度方式是采用矩阵图，列代表核心一致性维度，行代表不同的事实表，可通过在适当的交叉点放置检查标志来阐明一致性。一致性维度是维度建模的关键，缺乏一致性，就难以

overfit同步小助手 2024-07-02 00:04:26 0 收藏

Hive期末总结

Hive总结

overfit同步小助手 2024-07-01 18:03:33 0 收藏

hadoop学习---基于Hive的教育平台数据仓库分析案例（二）

overfit同步小助手 2024-07-01 14:03:28 0 收藏

数据仓库之数据字典

数据字典是描述数据仓库中数据结构、内容、关系及其他元数据的工具。它为数据仓库用户提供了数据仓库中数据的全面视图，帮助他们理解和使用数据。

overfit同步小助手 2024-07-01 12:03:45 0 收藏

小时候的子弹击中了现在的我-hive进阶：案例解析（第18天）

本文主要介绍hive的表操作，内外部表，分区分桶表，hive复杂类型，Hive乱码解决。

overfit同步小助手 2024-06-30 23:04:08 0 收藏

Hive&Hadoop面试常用问题（精修篇）

该章节主要针对Hive和Hadoop做面试的常用问题做了汇总和解答

overfit同步小助手 2024-06-29 16:03:26 0 收藏

不止是只有维度建模，数据仓库还有Data Vault建模

在数据仓库设计中，传统的星型和雪花型模型有着各自的优势和劣势。随着数据量的增大和数据源的多样化，Data Vault（数据仓库）建模方法逐渐受到关注和应用。Data Vault建模是一种灵活、可扩展、适应性强的建模方法，特别适用于复杂和动态的数据环境

overfit同步小助手 2024-06-29 11:03:25 0 收藏

hive的安装与基本配置（超详细，超简单）

本文介绍了hive的详细安装过程与基本配置

overfit同步小助手 2024-06-28 10:03:41 0 收藏

Hive on spark 多表full join 数据丢失大坑

长方形表示各表id所属范围，t1可能有t2没有的id，同时t2也有可能有t1没有的id，当t1、t2两者full join on t1.id=t2.id 后，若再要对t3表进行full join可以，但是join条件为on t2.id=t3.id，或者说是on t1.id=t3.id的时候都会出现一

overfit同步小助手 2024-06-27 13:03:47 0 收藏

hive DDL 语句

ShowDescribe在hive中DATABASE|SCHEMA是等效的，可以相互替代oRESTRICT: 默认值，在数据库中存在表的时候会失败，但如果是手动复制到该数据库下的，因为元数据中并没有相关信息，所以照样可以删除成功oCASCADE: 不管是否库中有表，全部删除。

overfit同步小助手 2024-06-27 12:03:45 0 收藏

Hive的存储格式和压缩算法的特点和选择

HIVE 中默认的存储格式；一般使用在数据贴源层(ODS 或 STG) ，针对需要使用脚本 LOAD 加载数据到 HIVE 数仓表中的情况；需要把表里数据导出或直接可以查看等场景，作为BI供数易读性要比 ORC 高很多；数据存储时不压缩，因此磁盘的开销和数据解析开销比较大；TEXTFILE 可以结合

overfit同步小助手 2024-06-27 11:03:50 0 收藏

Hive环境配置以及安装步骤

以上步骤是一个基本的Hadoop集群安装和配置流程，具体细节可能因环境差异和版本不同而有所调整。在实际操作中，建议参考Hadoop官方文档和相关教程进行安装和配置。以上步骤仅供参考，具体安装和配置过程可能因环境和需求的不同而有所差异。在实际操作中，建议参考Hive官方文档和相关教程进行安装和配置。

overfit同步小助手 2024-06-27 07:03:42 0 收藏

数据仓库数据集成开源工具

数据集成是数据仓库建设的重要环节，开源工具在这一领域提供了许多强大的解决方案。以下是一些常见的开源数据集成工具，它们各自有独特的功能和特点：

overfit同步小助手 2024-06-27 01:03:38 0 收藏

【大数据离线项目二：数仓数据传输工具--DataX的使用】

数仓工具Data X 的使用！使用DataX是如何进行数据的传输也就是说怎么从mysql或者是SQLserver数据库将数据传输到hive数仓中！Data X怎么使用！数据的同步方式！

overfit同步小助手 2024-06-26 23:03:17 0 收藏

银行数仓项目实战（一）--什么是数据仓库

数据仓库技术是为了有效的把操作型数据集成到统一的环境中以提供决策型数据访问的各种技术和模块的总称，所做的一切都是为了让用户更快更方便查询所需要的信息，提供决策支持。1.数仓管理系统（Data Warehouse Management System，DWMS）：用于管理银行数据仓库的建设，维护和运营，

overfit同步小助手 2024-06-26 16:03:51 0 收藏

二百三十七、Hive——DWS层生成每个清洗字段的异常情况记录

Hive——DWS层生成每个清洗字段的异常情况记录

overfit同步小助手 2024-06-26 14:03:41 0 收藏