大数据数据仓库

【C/C++】用C语言写一个数据仓库，存储和修改数据

这个代码实现了一个简单的数据仓库，其中数据被存储在一个3x3的二维数组中。用户可以通过控制台界面与这个数据仓库进行交互，可以选择查看数据或者修改数据。

overfit同步小助手 2024-06-18 08:03:54 0 收藏

数据仓库及应用（hive基础）

Database：数据库，在HDFS中为hive.metastore.warehouse.dir目录下的一个文件夹。Tables：表，表由列构成，在表上可以进行过滤、映射、连接和联合操作，在HDFS中为数据库目录下的子目录。Hive表分为内部表和外部表：内部表类似于RDBMS中的表，由Hive管理

overfit同步小助手 2024-06-18 04:03:49 0 收藏

Hive单机版安装部署

在根目录下建立software文件夹：mkdir software。进入/software/hadoop/etc/hadoop文件夹。保存退出，使文件生效：source /etc/profile。保存退出，生效：source /etc/profile。进入配置文件夹：/software/hive/c

overfit同步小助手 2024-06-18 02:03:46 0 收藏

著名开源软件Greenplum突然关闭GitHub源码，数据仓库选型带来新变数

但是公司一直颠沛流离，从2005年创建，2010年被EMC收购（估值3亿美金），2012年纳入到Pivotal Software品牌，2015年对外开源，2020年Pivotal被VMWare收购，2023年VMWare又被博通收购。Greenplum是基于PostgreSQL开发的MPP数据仓库，

overfit同步小助手 2024-06-18 00:03:33 0 收藏

数据仓库的概念和作用？如何搭建数据仓库？

数据仓库是一个专门用于集成、存储和管理企业各类数据的系统。它将来自多个源头的数据整合到一个集中的位置，以提供一致性、可靠性的数据供各种分析和报告使用。数据仓库通常包括历史数据，允许企业对过去、现在和未来的数据进行深入的分析。数据仓库的设计追求高度的可查询性和性能，通常采用星型或雪花型的数据模型，通过

overfit同步小助手 2024-06-17 17:03:40 0 收藏

数据仓库面试题集锦（附答案和数仓知识体系(1)

数据仓库是一个面向主题的、集成的、相对稳定的、反映历史变化的数据集合，用于支持管理决策。1）数据仓库是用于支持决策、面向分析型数据处理；2）对多个异构的数据源有效集成，集成后按照主题进行重组，并包含历史数据，而且存放在数据仓库中的数据一般不再修改2、数据仓库和数据库的区别？从目标、用途、设计来说1）

overfit同步小助手 2024-06-16 10:03:19 0 收藏

hive图形化客户端工具

并且重启hive服务时，要以root用户登录，使用命令 hive --service hiveserver2 启动hive服务。hive部署完成后，路径$HIVE_HOME/jdbc/hive-jdbc-3.1.3-standalone.jar有有完整的hive的jdbc驱动，直接使用即可。dbea

overfit同步小助手 2024-06-15 20:03:44 0 收藏

数据仓库—建模方法论—纬度建模星型模型与雪花模型

综上所述，星型模型适用于简单的分析需求和对查询性能有较高要求的场景，而雪花模型适用于复杂的业务需求和对存储空间和灵活性有较高要求的场景。可以发现数据仓库大多数时候是比较适合使用星型模型构建底层数据Hive表，通过大量的冗余来提升查询效率，星型模型对OLAP的分析引擎支持比较友好，这一点在Kylin中

overfit同步小助手 2024-06-15 19:03:49 0 收藏

【Hadoop大数据技术】——Hive数据仓库（学习笔记）

Hive起源于Facebook，Facebook公司有着大量的日志数据，而Hadoop是实现了MapReduce模式开源的分布式并行计算的框架，可轻松处理大规模数据。然而MapReduce程序对熟悉Java语言的工程师来说容易开发，但对于其他语言使用者则难度较大。因此Facebook开发团队想设计一

overfit同步小助手 2024-06-15 19:03:35 0 收藏

Hive实验报告

(Press y|Y for Yes, any other key for No) 表示是否拒绝 root 用户远程登录，在键盘输入 n 和回车，表示允许 root 用户远程登录。((Press y|Y for Yes, any other key for No)表示是否更改 root 用户密码，在

overfit同步小助手 2024-06-14 19:04:21 0 收藏

hive-批量导出表结构，导入表结构

将all_create_table.txt打开，批量将create table 替换成；create table ，如果建的是外部表，就需要将create external table 替换成;（因为导出的每个表后面并没有加分号，导入的数据，每个表的建表语句要以分号结尾）使用use 数据库名，进入某

overfit同步小助手 2024-06-14 15:03:25 0 收藏

数据仓库技术及应用（Hive调优）

HiveSQL是一种声明式语言，用户提交的交互式查询，Hive会将其转换成MR任务。Hive提供EXPLAIN命令显示查询语句的执行计划，通过显示信息可以了解Hive如何将查询转换为MR。

overfit同步小助手 2024-06-14 12:03:50 0 收藏

基于 Hive 数据仓库的教育大数据分析平台（伪分布式）

Hive 数据仓库的教育大数据分析平台

overfit同步小助手 2024-06-14 11:03:27 0 收藏

Hive中left join 中的where 和 on的区别

overfit同步小助手 2024-06-13 12:03:31 0 收藏

大数据之数据仓库技术：ETL工具和Kettle简介

`ETL` 是实现商务智能(Business Intelligence，BI)的核心。一般情况下，ETL会花费整个BI项目三分之一的时间，因此ETL设计得好坏直接影响BI项目的成败。如果说 `数据仓库` 的模型设计是一座大厦的设计蓝图，数据是砖瓦的话，那么 `ETL` 就是建设大厦的过程。

overfit同步小助手 2024-06-13 07:03:49 0 收藏

Hive连接函数 concat 和 concat_ws 使用示例

CONCAT 函数：适用于简单的字符串拼接操作，将多个字符串连接成一个新的字符串。可以用于创建自定义的文本字段，合并多个字段的内容，或者添加固定的分隔符。适合在SQL查询中进行简单的字符串合并操作，不涉及复杂的逻辑或条件。CONCAT_WS 函数：适用于需要指定分隔符的字符串拼接操作，其中 WS 表

overfit同步小助手 2024-06-12 22:03:37 0 收藏

FlinkSQL之Flink SQL Join二三事

Flink SQL支持对动态表进行复杂而灵活的连接操作。为了处理不同的场景，需要多种查询语义，因此有几种不同类型的 Join。默认情况下，joins 的顺序是没有优化的。表的 join 顺序是在FROM从句指定的。可以通过把更新频率最低的表放在第一个、频率最高的放在最后这种方式来微调 join

overfit同步小助手 2024-06-12 20:03:50 0 收藏

数据仓库技术及应用——概述

数据仓库是一种面向商务智能(BI) 活动（尤其是分析）的数据管理系统，它仅适用于查询和分析，通常涉及大量的历史数据。在实际应用中，数据仓库中的数据一般来自应用日志文件和事务应用等广泛来源。数据仓库的特点 / 优势。

overfit同步小助手 2024-06-12 10:03:50 0 收藏

Hive判空函数 COALESCE 和 NVL 使用示例

COALESCECOALESCE函数用于返回参数列表中第一个非NULL的数值或表达式。语法： COALESCE(value1, value2, …) ，参数可以是多个数值或表达式。返回值：返回参数列表中第一个非NULL的数值或表达式，如果所有参数均为NULL，则返回NULL。示例： SELECT C

overfit同步小助手 2024-06-12 10:03:34 0 收藏

kettle构建基于sakila数据库的DVD租赁商店数据仓库

构建sakila的星型租赁模型数据仓库

overfit同步小助手 2024-06-12 08:03:52 0 收藏