hive 日期和时间戳互相转化
一 . 日期转时间戳1 unix_timestamp()获取当前时间戳select unix_timestamp(); --16364622392 unix_timestamp() 输入日期参数 输入的时间格式必须符合 yyyy-MM-dd HH:mm:ssselect unix_timestamp
Kettle(二)数据同步、迁移(基础版)
Kettle数据同步、迁移基础版本
Hbase常用命令
Hbase常用命令
1——Hive数仓项目完整流程(在线教育)
在线教育数仓实战
【实战-01】flink cdc 实时数据同步利器
对很多初入门的人来说是无法理解cdc到底是什么个东西。有这样一个需求,比如在mysql数据库中存在很多数据,但是公司要把mysql中的数据同步到数据仓库(starrocks), 数据仓库你可以理解为存储了各种各样来自不同数据库中表。数据的同步目前对mysql来说比较常见是方式是使用:datax
数仓之全量表、增量表、快照表、切片表、拉链表
数仓之全量表、增量表、快照表、切片表、拉链表
hive中字符串查找函数 instr 和 locate
可用于优化join or关联匹配情况
数仓模型之维度建模
理解Kimball 最先提出的维度建模
大数据技术系列:图解【大数据平台开发】
数据治理的最终目标是提升数据利用率和数据价值,通过有效的数据资源管控手段,实现数据的看得见、找得到、管得住、用得好,提升数据质量和数据价值。企业数据治理非常必要,它是企业实现数字化转型的基础,是企业的一个顶层策略,一个管理体系,也是一个技术体系,涵盖战略、组织、文化、方法、制度、流程、技术和工具等多
数据建模:维度建模
数据建模:维度建模一、数据建模概述二、维度建模1、维度建模过程2、维度建模的基本要素3、维度建模过程举例一、数据建模概述1、数据模型级别概念数据模型:是用一系列相关主题域的集合来描述概要数据需求。概念模型仅仅包括给定的领域和职能中基础和关键的业务实体,同时也给出实体与实体之间关系的描述。逻辑数据模型
达梦VS金仓:选哪个国产数据库?比一比,看看哪个更优!
本文介绍了武汉达梦、人大金仓两家国产数据库的优劣,同时对两款数据库做出对比,从不同维度出发,助力各位找到适合自己的数据库
关于ETL的两种架构(ETL架构和ELT架构)
在ELT架构中,ELT只负责提供图形化的界面来设计业务规则,数据的整个加工过程都在目标和源的数据库之间流动,ELT协调相关的数据库系统来执行相关的应用,数据加工过程既可以在源数据库端执行,也可以在目标数据仓库端执行(主要取决于系统的架构设计和数据属性)。当ETL过程需要提高效率,则可以通过对相关数据
五种常见软件架构风格
描述五种软件架构风格
本地数据仓库项目(一) —— 本地数仓搭建详细流程
搭建离线数仓,并实现数据采集到简单数据分析过程
新一代数据仓库SnowFlake
Snowflake是一种多租户、事务性、安全、高度可扩展的弹性系统,具备完整的SQL支持和半结构化和schema-less数据模式支持。用户只需将数据导入云上,就可以立即利用他们熟悉的工具和界面进行管理和查询。从2012年底,Snowflake开始计划实施,到2015年6月,Snowflake已经可
数仓工具——DolphinScheduler任务调度工具
数仓学习——DolphinScheduler任务调度工具前言一、DolphinScheduler简介1.DolphinScheduler概述2.DolphinScheduler组件3.DolphinScheduler核心架构二、DolphinScheduler部署说明1.软硬件环境要求1.1 操作系
基于Apache Doris数仓平台架构设计
Apache Doris数仓平台架构设计
数据仓库介绍(DW)
数据仓库介绍
Hive--时间函数大全
hive时间函数1. current_date():获取当前格式化日期2. current_timestamp():获取当前格式化时间3. unix_timestamp():获取当前unix时间戳4. from_unixtime():把unix时间戳转化为格式化时间5. to_date(): 当前格
大数据面试题--数仓
目录数据仓库理论数据分层E T L星形模型与雪花模型的区别?维度建模(dimensional modeling):数据仓库项目最重要或需要注意的是什么,以及如何处理?关系建模与维度建模拉链表:维度表和事实表数据仓库中的维度和粒度维度建模步骤:如何构建数据仓库?Flink面试题Flink的重启策略:F