【Hive】基本建库、建表操作
文章目录一、Hive 数据仓库的操作1、创建数据仓库2、查看 db 数据仓库的信息及路径3、删除 db 数据仓库二、Hive 数据表的操作1、创建内部表2、创建内部表3、修改表结构4、删除表5、创建同结构表三、Hive 中数据的导入导出环境准备Hadoop 完全分布式(一主两从即可)MySQL环境、
hiveSQL开窗函数详解
窗口函数也称OLAP函数,对数据库进行实时分析处理。
hive时间和字符串互转,时间函数
hive里经常需要将字符串转化为date或timestamp 或者转化为日期格式的string先说一个简单的 cast(xx as date/string/timestamp) 这个大多情况都可以用。
数据同步之全量同步与增量同步
一、什么是数据同步业务数据是数据仓库的重要数据来源,我们需要每日定时从业务数据库中抽取数据,传输到数据仓库中,之后再对数据进行分析统计。为保证统计结果的正确性,需要保证数据仓库中的数据与业务数据库是同步的,离线数仓的计算周期通常为天,所以数据同步周期也通常为天,即每天同步一次即可。数据的同步策略有全
HIVE 3 使用 MR 引擎多表关联 (JOIN) 导致丢数的问题复现、问题根源及解决方案 (附代码)
HIVE 3 使用 MR 引擎多表关联 (JOIN) 导致丢数的问题复现、问题根源及解决方案 (附代码)
hive之full outer join(全连接)使用方法
目录介绍语法例子创建顾客表:customers创建订单表:ordersfull outer join语句 left join + union + right join语句介绍full outer join结合了 LEFT JOIN 和 RIGHT JOIN 的结果,并使用NULL值作为两侧缺失匹配结
dbever连接kerberos认证的hive
dbever连接kerberos认知的hive
Hive表DDL操作(一)
Hive表DDL操作(一);表分区;Create/Alter/Drop 数据库;Create/Drop/Truncate 表;Alter 表/列
hive limit分页查询、row_number()分页查询
hive执行limit语句报错,分页失败如: (1)按照deptno分组,不排序 (2)按照empno进行排序,不分组,排序列命名rownum (3)按照empno排序,同时根据deptno进行分组 从原表中查询第6到第10行数据注: row_number最好写一个,不然每次都排序很耗
黑马Hive+Spark离线数仓工业项目--项目总结
黑马Hive+Spark离线数仓工业项目--项目总结
连接HiveServer2的图形化工具SQuirrel和Dbeaver
文章目录SQuirrel SQL Client简介视频演示安装SQuirrel SQL Client启动hdfs和hiveserver2配置SQuirrel SQL Client使用SQuirrel SQL Client访问hive使用Cloudera提供的hive连接驱动进行连接Dbeaver的安
Hive远程连接设置用户名和密码
hive设置用户名密码
flink-sql读写hive-1.13
本文按照 flink 1.13 官网中的读写 hive 内容翻译整理,内容十分全面。
Hive 中的各种常用set设置
hive 中的常用set语句设置
线上 hive on spark 作业执行超时问题排查案例分享
m分享一个某业务系统的线上 hive on spark 作业在高并发下频现作业失败问题的原因分析和解决方法
Spark-SQL连接Hive 的五种方法
Spark-SQL连接Hive 的五种方法
【大数据存储技术】「#3」将数据从Hive导入到MySQL
【代码】【大数据存储技术】「#3」将数据从Hive导入到MySQL。
hive启动失败,报 java.net.ConnectException:拒绝连接
hive服务器需要依赖hadoop服务器,所以要先启动hadoop集群。
hive学习(仅供参考)
hive安装