解决hive表中文乱码问题

hive字段名称和字段描述等存储进如hivemetastore是中文,查询出来也是???等无法识别的中文乱码;

Hive常用的日期函数

HiveSQL中较为常用的日期处理函数整理汇总

Hive合并小文件详解(参数介绍)

一、MR输出时合并小文件参数设置 含义set hive.merge.mapfiles=true; 默认值ture,在Map-only的任务结束时合并小文件set hive.merge.mapredfiles=true; 默认值false,在Map-Reduce的任务结束时合并小文件set hive.

Hive的安装与配置详解

Hive的安装与配置详解

大数据项目实战-招聘网站职位分析

本项目是通过hadoop生态系统基于大数据离线处理技术完成的。利用HDFS存储数据、MapReduce做批量计算,将计算完成的数据存储在Hive数据仓库中。

基于用Hive泰坦尼克号乘客信息存储与分析

基于用Hive泰坦尼克号乘客信息存储与分析

hive基础选择题

1.下列关于Hive特点总结正确的选项是()A Hive支持自由的扩展集群的规模,只需要重启服务即可B Hive支持自定义函数,用户可以根据自己的需求去定义函数C Hive SQL执行时,需要避免节点出现问题D Hive 适合处理小批量数据【B】A. 错误,Hive一般不需要重启服务就可以扩展集群B

【头歌】Sqoop 操作 HBase - 详解

【主要内容】Sqoop 在HBase中导入;Sqoop 在HBase中导出。【实践内容】全过程解析及编程内容。

从‘discover.partitions‘=‘true‘分析Hive的TBLPROPERTIES

找到了Hive的MetaStore存储的元数据,并且分析出了和表配置相关的运行机理

大数据之 impala教程

Impala是用于处理存储在Hadoop集群中的大量数据的MPP(大规模并行处理)SQL查询引擎。

Hive的基本操作之数据导入表

进入所要导数据的表所在的库:hive> select current_database();OKtest2建表hive> create table test_user( > id int, > name string > ) > row f

1/50 hive sql 日期处理函数

hive sql 常用的日期处理函数用法

Hive中的map类型及其操作

在k-v对中,若value有多个值的情况,如 {‘k1’:‘01,02,03’} ,如果要用 ‘k1’ 中 '02’作为过滤条件,则语句如下:(这里用到split来处理)判断map中是否包含某个key值:array_contains(map_keys(k_v),‘A’)或者k_V[“A”] is n

Hive优化总结

一、SQL本身的优化1、只select需要的列,避免select *2、where条件写在子查询中,先过滤再关联3、关联条件写在on中,而不是where中4、数据量大时,用group by代替count distinct5、数据量小时,用in代替join6、避免笛卡尔积7、join时大表放后面,使用

sqllineage解析sql列级血缘并提交到datahub

通过sqllineage获取指定sql文件中HiveSQL的字段级血缘关系,并将结果提交到datahub

Hbase/Hive知识概要

hbase,hive

Hive/MaxCompute SQL性能优化(三):数据倾斜优化实战

前面介绍了如何定位数据倾斜,本文介绍如果遇到各种数据倾斜的情况该怎样优化代码。

Hudi数据湖技术之数据中心案例实战

目录1 案例架构2 业务数据2.1 客户信息表2.2 客户意向表2.3 客户线索表2.4 线索申诉表2.5 客户访问咨询记录表3 Flink CDC 实时数据采集3.1 开启MySQL binlog3.2 环境准备3.3 实时采集数据3.3.1 客户信息表3.3.2 客户意向表3.3.3 客户线索表

【头歌】Sqoop数据导入 - 详解

【主要内容】Sqoop数据导入语法学习;Mysql导入数据至HDFS上;Mysql导入数据至Hive中。【实践内容】全过程解析及部分异常处理办法。

Hive本地模式安装(详细)

本地模式安装采用外部数据库存储元数据,该模式不需要单独开启Metastore服务,因为本地模式使用的是和Hive在同一个进程中的Metastore服务。

登录可以使用的更多功能哦! 登录
作者榜
...
资讯小助手

资讯同步

...
内容小助手

文章同步

...
Deephub

公众号:deephub-imba

...
奕凯

公众号:奕凯的技术栈