大数据大比拼:Hive vs HBase,你知道两者的区别和适用场景吗?

Apache Hive和Apache HBase是两个非常流行的分布式数据存储技术。尽管两者都是Apache软件基金会的项目,但它们被设计用于不同的用例。在本篇博客中,我们将介绍Hive和HBase的基本概念,以及它们的区别和应用场景。

sparkSQL连接hive失败案例和解决办法

sparkSQL连接hive失败案例和解决办法

Hive知识梳理

Hive是建立在 Hadoop 上的数据仓库基础构架。可以将SQL查询转换为MapReduce的job在Hadoop集群上执行。

一文弄懂Hive中谓词下推(on与where的区别)

Hive谓词下推与where和on的使用时机,一文就能理解透彻

hadoop基础搭建(hadoop+hive+hbase+zk)(一)

关于hadoop的基础搭建

大数据核心技术是什么

大数据的核心层:数据采集层、数据存储与分析层、数据共享层、数据应用层,可能叫法有所不同本质上的角色都大同小异。数据采集的任务就是把数据从各种数据源中采集和存储到数据存储上,期间有可能会做一些简单的清洗。数据源的种类比较多:网站日志:作为互联网行业,网站日志占的份额最大,网站日志存储在多台网站日志服务

hive数据倾斜(超详细)

说到hive的数据倾斜,可能有的小伙伴还不了解什么是数据倾斜,所以咱们这一次就从hive数据倾斜的表现、hive数据倾斜发生的原因、hive数据倾斜的解决方案这三个方面来聊一聊hive的数据倾斜。

Hive数据仓库应用课后题及答案

Hive数据仓库应用课后题及答案

一文学完所有的Hive Sql(两万字最全详解)

Hive Sql 大全本文基本涵盖了Hive日常使用的所有SQL,因为SQL太多,所以将SQL进行了如下分类: 一、DDL语句(数据定义语句):对数据库的操作:包含创建、修改数据库对数据表的操作:分为内部表及外部表,分区表和分桶表二、DQL语句(数据查询语句):单表查询、关联查询hive函数:包含聚

大数据NiFi(二十):实时同步MySQL数据到Hive

连接关系中,我们这里只关注“insert”和“update”的数据,后期获取对应的属性将插入和更新的数据插入到Hive表中,对于“delete”的数据可以路由到其他关系中,例如需要将删除数据插入到另外的Hive表中,可以再设置个分支处理。登录mysql ,使用“mynifi”库,创建表“test2”

数据倾斜的原因及解决方案

一、什么是数据倾斜及数据倾斜是如何产生的数据倾斜的根本原因是数据的key分布不均,个别key数据很多,超出了计算节点的计算能力的结果;过程:数据经过 map后,由于不同key 的数据量分布不均,在shuffle 阶段中通过 partition 将相同的 key 的数据打上发往同一个 reducer

大数据面试题(八):Hive优化措施

Fetch抓取Fetch抓取是指Hive中对某些情况的查询可以不必使用MapReduce计算。例如:SELECT * FROM employees;在这种情况下,Hive可以简单地读取employee对应的存储目录下的文件,然后输出查询结果到控制台。在hive-default.xml.templat

教你使用Sqoop一次性将mysql中的十张表导入到hive中

sqoop数据同步工具的使用一文教你学会使用sqoop将mysql数据库中的十张表导入到大数据平台hive中

Hive最全总结,学习与面试,收藏这一篇就够了!

UDF:用户自定义函数,user defined function。一对一的输入输出。UDTF:用户自定义表生成函数。user defined table-generate function.一对多的输入输出。UDAF:用户自定义聚合函数。user defined aggregate functio

DBeaver连接hive(详细图解)

dbeaver是免费和开源(GPL)为开发人员和数据库管理员通用数据库工具。易用性是该项目的主要目标,是经过精心设计和开发的数据库管理工具。免费、跨平台、基于开源框架和允许各种扩展写作(插件)。它支持任何具有一个JDBC驱动程序数据库。它可以处理任何的外部数据源。

描述大数据的技术生态?Hadoop、Hive、Spark 之间是什么关系

作者:小怪兽链接:https://www.zhihu.com/question/27974418/answer/1862026844来源:知乎著作权归作者所有。商业转载请联系作者获得授权,非商业转载请注明出处。1Hadoop只是一套工具的总称,它包含三部分:HDFS,Yarn,MapReduce,功

【Python】全网最详细的Python入门基础教程(非常详细,整理而来)

标识符在 Python 中,所有标识符可以包括英文(区分大小写的)、数字以及下划线(_),但不能以数字开头。以单下划线开头 _foo 的代表不能直接访问的类属性,需通过类提供的接口进行访问,不能用 from xxx import * 而导入。以双下划线开头的 __foo 代表类的私有成员,以双下划线

hive 的 lateral view用法以及注意事项

1. lateral view 简介  hive函数 lateral view 主要功能是将原本汇总在一条(行)的数据拆分成多条(行)成虚拟表,再与原表进行笛卡尔积,从而得到明细表。配合UDTF函数使用,一般情况下经常与explode函数搭配,explode的操作对象(列值)是 ARRAY 或者 M

30分钟掌握 Hive SQL 优化(解决数据倾斜)

如果joinkey有集中的空值热点值,这些空值会聚集到少数个分区中,导致长尾问题。

SQL:数据去重的三种方法

SQL中去除重复数据

登录可以使用的更多功能哦! 登录
作者榜
...
资讯小助手

资讯同步

...
内容小助手

文章同步

...
Deephub

公众号:deephub-imba

...
奕凯

公众号:奕凯的技术栈