数据仓库Hive(林子雨课程慕课)

Hive特点传统的数据仓库既是数据存储产品也是数据分析产品传统的数据仓库能同时支持数据的存储和处理分析Hive本身并不支持数据存储和处理其实只是提供了一种编程语言其架构于Hadoop之上,Hadoop有支持大规模数据存储的组件HDFS,以及支持大规模数据处理的组件MapReduceHive借助于这两

Hive【Hive(三)查询语句】

Hive 查询语句、基本查询、分组、排序、join

Hive解析Json数组超全讲解

在Hive中会有很多数据是用Json格式来存储的,如开发人员对APP上的页面进行埋点时,会将多个字段存放在一个json数组中,因此数据平台调用数据时,要对埋点数据进行解析。接下来就聊聊Hive中是如何解析json数据的。结果:namezhangsan如果既要解析name字段,也解析age字段,则可以

hive 如何处理json字符串

hive处理json字符串以及json数组

MySQL中的业务数据该如何正确导入到Hive中 - Sqoop

业务系统中的数据如何导入到HDFS系统中,并加载到Hive数仓中

【hive 运维】hive注释/数据支持中文

【hive 运维】hive注释/数据支持中文

spark读取hive表字段,区分大小写问题

spark任务读取hive表,查询字段为小写,但Hive表字段为大写,无法读取数据。

Hive 建表客户端报错 missing EOF at “/“

后来把sql中的注释去掉以后,或者把注释开头替换成 – 此异常便可以解决。在创建表时,我使用的是idea客户端,报了如下错误。

【hive】hive修复分区或修复表 以及msck命令的使用

我们知道hive有个服务叫metastore,这个服务主要是存储一些元数据信息,比如数据库名,表名或者表的分区等等信息。如果不是通过hive的insert等插入语句,很多分区信息在metastore中是没有的,如果插入分区数据量很多的话,你用。在 Hive 中,当您向分区表添加、删除或更改分区数据时

hiveserver2经常挂断的原因

配置问题:不正确的配置可能导致 HiveServer2 发生问题。如果资源不足,可能会导致 HiveServer2 挂断。Hive 版本问题:某些 Hive 版本可能存在已知的问题或 bug,可能会导致 HiveServer2 挂断。确保使用的 Hive 版本是稳定的,最好是已修复了已知问题的最新版

linux centos7环境下初始化hive时报错*** schemaTool failed ***

linux centos7环境下初始化hive时报错*** schemaTool failed ***

insert overwrite table:数据仓库和数据分析中的常用技术

"INSERT OVERWRITE TABLE:清空和重新加载表中的数据"

hive可以删除单条数据吗

参考:hive只操作几条数据特别慢 hive可以删除单条数据吗_柳随风的技术博客_51CTO博客

一篇文章教会你搭建Hive分布式集群

Hive是基于Hadoop的一个数据仓库工具,可以将结构化的数据文件映射为一张表,并提供类SQL查询功能。在大数据技术生态体系中扮演着重要的角色,今天我们就通过一篇文章来教会你如何搭建部署Hive分布式集群。

hive库操作示例

1、hive库基本操作;2、hive库分区表常见操作;3、关于删除及更新的描述;4、分区表数据插入、删除;5、分桶表数据插入、删除;6、java客户端采用jdbc操作hive库;

Hive创建外部表详细步骤

② 在hive中执行HDFS命令:上传/emp.txt至HDFS的data目录下,并命名为emp_out。① 在hive中执行HDFS命令:创建/data目录。③ 创建外部表:emp_out。

SparkSQL与Hive整合(Spark On Hive)

hive metastore元数据服务用来存储元数据,所谓元数据,即hive中库、表、字段、字段所属表、表所属库、表的数据所在目录及数据分区信息。元数据默认存储在hive自带的Derby数据库。metastore服务独立出来之后,1个或多个客户端在配置文件中添加metastore的地址,就可以同时连

配置Hive使用Spark执行引擎

在Hive中,可以通过配置来指定使用不同的执行引擎。Hive执行引擎包括:默认MR、tez、spark。

【大数据之Hive】十六、Hive-HQL函数之窗口函数(开窗函数)

  先定义了窗口的大小(按行来算),然后对窗口内的行的数据进行计算,再将计算结果返回给改行。  窗口函数包括窗口和函数两部分,窗口用于定义计算范围,函数用于定义计算逻辑,窗口函数只会在原来的表上增加一列结果列,不改变原来的数据。函数:  绝大多数聚合函数都可以配合窗口使用,如max(),min(),

Hive字符串数组json类型取某字段再列转行

hive 数组 json 列转行

登录可以使用的更多功能哦! 登录
作者榜
...
资讯小助手

资讯同步

...
内容小助手

文章同步

...
Deephub

公众号:deephub-imba

...
奕凯

公众号:奕凯的技术栈