大数据数据仓库

Hive-函数总结

Hive函数总结，简单实用，举例

overfit同步小助手 2024-02-07 19:03:35 0 收藏

数据仓库现代化和迁移解决方案Datametica

Datametica在自动化工具的帮助下,通过在整个数据管道(从数据湖评估到数据湖分析)中使用循环流程，确保数据湖的成功实施。Datametica在自动化工具的帮助下，在整个数据管道(从数据湖评估到数据湖分析)中使用循环流程，确保数据湖的成功实施。这些工具简化并自动化了数据迁移过程，帮助企业实现数据

overfit同步小助手 2024-02-06 09:03:48 0 收藏

HiveSQL题——用户连续登陆

overfit同步小助手 2024-02-06 08:03:25 0 收藏

数据仓库模型设计：从架构到实践的全方位指南

数仓主题是指通过“上帝视角”将企业不同业务流程信息进行分类、汇总，然后对其进行分析利用的一个抽象化概念。也是企业中某一分析领域具体的分析对象，每个数仓分析领域都又一个数仓主题相呼应。

overfit同步小助手 2024-02-06 05:03:41 0 收藏

数据仓库-相关概念

数据仓库是一个用于集成、存储和管理大量数据的系统。它用于支持企业决策制定过程中的数据分析和报告需求。数据仓库从多个来源收集和整合数据，并将其组织成易于查询和分析的结构。数据仓库的主要目标是提供高性能的数据访问和分析能力，以便用户可以从不同的角度和层次上理解和解释数据。它通常包含历史数据，用于支持趋势

overfit同步小助手 2024-02-06 00:03:43 0 收藏

【hive】- 使用insert into/insert overwrite插入数据到静态分区、动态分区、动静态分区

使用insert into/insert overwrite插入数据到静态分区、动态分区、动静态分区

overfit同步小助手 2024-02-05 16:03:24 0 收藏

一文了解数据库，数据仓库，数据湖，数据集市，数据湖仓

数据库，数据仓库，数据湖，数据集市，数据湖仓的相同点和区别。

overfit同步小助手 2024-02-05 09:03:39 0 收藏

Hive权限管理

基于存储的授权 - 可以对Metastore中的元数据进行保护，但是没有提供更加细粒度的访问控制（例如：列级别、行级别）。基于SQL标准的Hive授权 - 完全兼容SQL的授权模型，推荐使用该模式。hive默认授权 - 设计目的仅仅只是为了防止用户产生误操作，而不是防止恶意用户访问未经授权的数据。

overfit同步小助手 2024-02-04 14:03:46 0 收藏

【美团】交易系统平台-数据仓库研发工程师

更新时间：2024/01/28｜工作地点：北京市｜事业群：到家事业群｜工作经验：3年到家研发平台秉承“零售+科技”战略，致力于推动餐饮、零售需求侧和供给侧数字化升级，构建了超大规模的在线交易平台和实时调度系统，保障了百万商家和亿级用户的高效安全交易，实现了对百万骑手所在物理世界全链路的数字化。随着万

overfit同步小助手 2024-02-04 12:03:33 0 收藏

数据仓库与Hadoop：如何实现大规模数据处理

1.背景介绍数据仓库和Hadoop都是处理大规模数据的重要技术，它们在现代数据科学和人工智能中发挥着至关重要的作用。数据仓库是一种用于存储和管理大量历史数据的系统，主要用于数据分析和报告。而Hadoop是一个开源的分布式文件系统和数据处理框架，主要用于处理大规模、分布式的实时数据。在本文中，我们将深

overfit同步小助手 2024-02-04 09:03:24 0 收藏

Hive初体验

{runjar就是metastore；hadoop要先启动 }进入到Hive Shell 环境中，可以直接执行SQL的语句；首先，确保启动了Metastore服务。

overfit同步小助手 2024-02-02 23:03:52 0 收藏

【Hive_05】企业调优1（资源配置、explain、join优化）

Explain呈现的执行计划，由一系列Stage组成，这一系列Stage具有依赖关系，每个Stage对应一个MapReduce Job，或者一个文件系统操作等。stage可以对应mr，也可以对应文件系统操作。因为不是所有的sql语句的底层都是mr。比如说load语句，底层就不是mr而是文件系统操作。

overfit同步小助手 2024-02-02 19:03:34 0 收藏

2024大数据“打假”：什么才是真湖仓一体？

湖仓一体是通过一套架构，满足所有的分析需求，抽象化的描述，要能实现 One Data、All Analytics 的业务价值。

overfit同步小助手 2024-02-02 06:03:34 0 收藏

SparkSQL和Hive语法差异

rand()nullvoidCTAS建表。

overfit同步小助手 2024-02-02 00:03:30 0 收藏

第二十章：DMP数据平台的数据湖与数据仓库

1.背景介绍1. 背景介绍数据湖(Data Lake)和数据仓库(Data Warehouse)是两种不同的数据存储方法，它们在数据处理和分析方面有着各自的优缺点。数据湖是一种存储大量原始数据的方式，数据仓库则是针对特定的数据分析和报告需求进行预先处理和存储的方式。在本文中，我们将深入探讨数据湖和数

overfit同步小助手 2024-01-31 22:03:19 0 收藏

【数据仓库与联机分析处理】多维数据模型

数据仓库和OLAP工具是基于多维数据模型的，该模型以数据立方体（Cube）的形式来观察和分析数据。本篇文章介绍多维数据模型。

overfit同步小助手 2024-01-31 17:03:46 0 收藏

3分钟带你了解：数据仓库能为你做点啥

数据仓库的建设目标，是融合多领域数据，建设企业级标准化、统一、可共享的全、准、快、省、通的全部数据体系，給下游提供稳定数据服务。，指经过一系列的业务逻辑、技术逻辑加工后的，产生的口径统一的公共数据，具备高质量、高时效、一致口径等特性，常用于运营报表、经营分析、财务结算、风控策略等场景；灵活的查询，可

overfit同步小助手 2024-01-31 13:03:45 0 收藏

Hive09_函数

split( “category” , “,”) -----> [ “悬疑” ， “动作”, “科幻”, “剧情” ] array。果 value 为 NULL，则 NVL 函数返回 default_value 的值，否则返回 value 的值，如果两个参数。NVL：给

overfit同步小助手 2024-01-30 23:03:29 0 收藏

数据仓库面试题

数仓基础常见面试题

overfit同步小助手 2024-01-30 17:03:49 0 收藏

Hive运算符和函数

实现三个方法：initialize初始化、evaluate实现功能、帮助文档initialize方法只处理类型，就是在select 函数的时候，反序列化读取数据时，需要确认数据以什么类型返回的；evaluate方法只处理真实数据。/****/// 定义出读取出的文件类型/*** 初始化只用来

overfit同步小助手 2024-01-30 14:03:45 0 收藏