Hive--清除/删除Hive表数据

大数据技术指的是用于处理、分析和管理大规模数据集的技术和工具。随着互联网和物联网的普及,数据量不断增大,对数据的处理和分析需求也日益增加,大数据技术应运而生

Hive(23):Select高级查询之SORT/ORDER/CLUSTER/DISTRIBUTE BY

order by会对输入做全局排序,因此只有一个reducer,会导致当输入规模较大时,需要较长的计算时间。sort by不是全局排序,其在数据进入reducer前完成排序。因此,如果用sort by进行排序,并且设置mapred.reduce.tasks>1,则sort by只保证每个reduce

HIVE创建分区表

partitioned by ( c2 string ) # 创建分区 c1跟c2都是字段,但是创建的时候不能写在t2里面,只能写在分区里面(同时select查询的时候,c2的字段也要写在最后面)注意:当你退出过hive后,再次进入hive,不要忘记使用了哪个database,我这里使用的是te

Hive Code2报错排查

大多数可能的code2报错一般是内存不够,所以加下面这个配置可以有效解决这个问题#取消小表加载至内存中但这个不一定是因为内存不够,其实很多错误都是报这种官方错误的,所以一定要去yarn上看日志。很多人看日志也找不到问题,因为并没有看到全部日志,翻到最底下,点击check here 才能看到完整日志。

Kerberos安全认证-连载10-Hive Kerberos 安全配置及访问

技术连载系列,前面内容请参考前面连载9内容:​​​​​​​Hive底层数据存储在HDFS中,HQL执行默认会转换成MR执行在Yarn中,当HDFS配置了Kerberos安全认证时,只对HDFS进行认证是不够的,因为Hive作为数据仓库基础架构也需要访问HDFS上的数据。因此,为了确保整个大数据环境的

关于Java连接Hive,Spark等服务的Kerberos工具类封装

关于Java连接Hive,Spark等服务的Kerberos工具类封装

hive on spark 时,executor和driver的内存设置,yarn的资源设置

hive on spark 时,executor和driver的内存设置,yarn的资源设置。

构建大数据环境:Hadoop、MySQL、Hive、Scala和Spark的安装与配置

安装Hadoop 首先,从Apache Hadoop的官方网站下载所需的Hadoop发行版。选择适合你系统的二进制发行版,下载完成后解压缩到安装目录。然后配置环境变量,并修改Hadoop的配置文件,根据需要进行修改。安装MySQL 安装MySQL服务器是搭建大数据环境的重要一步。更新包管理器后,执行

hive基于新浪微博的日志数据分析——项目及源码

本系统旨在对新浪微博日志进行大数据分析,探究用户行为、内容传播、移动设备等多个方面的特征和趋势,为企业和个人的营销策略、产品设计、用户服务等提供有益的参考和支持。系统基于Hive平台,能够对大规模的微博数据进行处理和分析,输出有关用户量、微博转发量、用户发布微博数量、带图片微博数据等多个方面的统计信

hive之with as 和 create temporary区别

在写hivesql语句时,通常因为实现一个比较复杂的逻辑时。

Hive中的HASH函数规则及示例

Hive中的哈希函数采用的是MurmurHash算法,这是一种非常高效的哈希算法。该算法将输入数据分为若干个块,每个块都进行哈希计算,最终将所有块的哈希值合并起来得到最终的哈希值。在执行上述查询语句时,Hive会自动调用HASH函数对每个姓名进行哈希计算,并将具有相同哈希值的姓名放入同一个分组中,最

大数据技术之Spark——Spark SQL

我们之前学习过hive,hive是一个基于hadoop的SQL引擎工具,目的是为了简化mapreduce的开发。由于mapreduce开发效率不高,且学习较为困难,为了提高mapreduce的开发效率,出现了hive,用SQL的方式来简化mapreduce:hive提供了一个框架,将SQL转换成ma

hive创建唯一标识列(自增id)

hive创建唯一标识列(自增id)

Oracle 迁移 Hive 过程中遇到的问题总结

最近一个小伙伴在做从Oracle到Hive的业务迁移工作,在迁移过程中属实遇到了一些坑,今天就来汇总一下这些坑,避免以后大家其他业务迁移的时候再出现类似的问题,即使出现了也可以拿过来进行对照解决。在迁移业务的过程中,要了解不同系统中函数的用法,希望我遇到的坑,给大家带来一点借鉴意义!

Hive调优之计算资源配置(一)

hive调优

flink-sql读写hive-1.16

本文为 flink 1.16 官网中读写 hive 部分的翻译整理。

Hive窗口函数-lead/lag函数

Hive窗口函数-lead/lag函数

SQL实现一行数据分组后转多行多列

通过聚合拆分再聚合的方式实现一行数据变分组的多行多列

hive中substring_index()的使用

hive sql substring_index

解决Hive视图View数据乱码的问题

解决Hive视图View数据乱码的问题

登录可以使用的更多功能哦! 登录
作者榜
...
资讯小助手

资讯同步

...
内容小助手

文章同步

...
Deephub

公众号:deephub-imba

...
奕凯

公众号:奕凯的技术栈