大数据 Hive - overfit.cn

2023.11.10 hadoop,hive框架概念,基础组件

任务:1.确认hadoop,hive环境搭建完成2.确认能使用hadoop,hive启动服务的命令,datagrip连接hive服务操作3.背诵/流畅表达 hadoop的架构,各组件之间的关系4.说明hive的流程,元数据的概念。

overfit同步小助手 2023-11-22 12:03:28 0 收藏

在 Flutter 中使用 Hive 的终极指南 Hive：适用于 Flutter 应用程序的完美本地数据库

Hive for Flutter：快速轻量级本地数据库Hive 是用于 Flutter 和 Dart 应用程序的快速轻量级键值数据库。这是在本地存储少量数据的绝佳选择，例如用户偏好、游戏分数或购物车。对于需要能够离线工作的应用程序，Hive 也是一个不错的选择。

overfit同步小助手 2023-11-21 22:03:30 0 收藏

HIVE基本查询操作（二）——第3关：Hive抽样查询

为了完成本关任务，你需要掌握：1.随机抽样 2.桶表抽样 3.数据块抽样。采用对列值哈希，然后除以桶的个数求余的方式决定该条记录存放在哪个桶当中。可以进一步组织成桶，也就是说桶是更为细粒度的数据范围划分。根据提示，在右侧编辑器补充代码，计算每个股票每天的交易量。语句可以获得同样的效果，但是性能没这

overfit同步小助手 2023-11-21 14:03:54 0 收藏

2023.11-9 hive数据仓库,概念,架构,元数据管理模式

当然，这个低是有条件的，即数据规模较小，当数据规模大到超过数据库的处理能力的时候，Hive 的并行计算显然能体现出优势。数据库可以用在 Online 的应用中，但是 Hive 是为数据仓库而设计的，清楚这一点，有助于从应用角度理解 Hive 的特性。由于 Hive 是针对数据仓库应用设计的，而数据仓

overfit同步小助手 2023-11-21 09:03:45 0 收藏

安装hive中初始化元数据库失败，显示Failed to get schema version

起初没有想通，认真看了一下发现password的密码可能有两种情况，一种是我配置mysql文件的密码也有可能是我虚拟机主机的密码，在想一下问题的解释，告诉我的是root用户密码拒绝我的服务访问，所以我试着修改成我的root机子的密码，于是就可以了。在网上找了几种方法都没解决成功，然后我又重新看了一下

overfit同步小助手 2023-11-21 06:03:50 0 收藏

hivesql开窗函数row number() over (partition by )详解

具体来说，ROW_NUMBER() 是一种分析函数，它可以根据 ORDER BY 子句中指定的列对行进行排序，并为每个分区内的行分配唯一的连续编号。ROW_NUMBER() OVER (PARTITION BY ) 是一种窗口函数，用于在每个分区内对行进行编号。ROW_NUMBER() OVER (

overfit同步小助手 2023-11-21 06:03:47 0 收藏

Hive从入门到大牛【Hive 学习笔记】

overfit同步小助手 2023-11-21 01:03:41 0 收藏

HIVE SQL regexp_extract和regexp_replace配合使用正则提取多个符合条件的值

平凡的世界》评分不错，《巴黎圣母院》改变成的电影不错，还有也蛮好看。《平凡的世界》评分不错，《巴黎圣母院》改变成的电影不错，还有《1984》,《平凡的世界》,《巴黎圣母院》,《1984》时的值，此操作的主要目的为剔除最后一个书名号。函数将以上文本中所有书籍名称都提取出来？将书名号前边的内容替换成。

overfit同步小助手 2023-11-20 04:03:37 0 收藏

【hive】列转行—collect_set()/collect_list()/concat_ws()函数的使用场景

overfit同步小助手 2023-11-19 05:03:30 0 收藏

2023-Hive必备详细教程

overfit同步小助手 2023-11-18 02:03:51 0 收藏

hive的concat()、concat_ws()和collect_list()、collect_set()的用法

overfit同步小助手 2023-11-17 13:03:41 0 收藏

大数据Hadoop之——部署hadoop+hive+Mysql环境（window11）

win环境下大数据Hadoop的部署hadoop+hive环境

overfit同步小助手 2023-11-17 10:03:51 0 收藏

大数据之使用Spark增量抽取MySQL的数据到Hive数据库（2）

本题来源于2022 年全国职业院校技能大赛（高职组）“大数据技术与应用”赛项（电商）- 离线数据处理 - 数据抽取数据处理需要灵活的使用sql函数或者spark相关函数对数据进行处理，但思路总体上一样。对于数据处理，还需要掌握好一些非常见但是又很使用的函数。可以与大数据之使用Spark增量抽取M

overfit同步小助手 2023-11-17 10:03:34 0 收藏

SQL时间函数

SQL语句时间函数

overfit同步小助手 2023-11-17 00:03:47 0 收藏

hive分位函数percentile和percentile_approx误区和解决方案

percentile和percentile_approx对分位数的计算

overfit同步小助手 2023-11-16 05:03:38 0 收藏

Spark 增量抽取 Mysql To Hive

【代码】Spark 增量抽取 Mysql To Hive。

overfit同步小助手 2023-11-15 16:03:16 0 收藏

【SQL相关】Hive中空值与Null的判断及处理

如果a字段值为null，那么null转化为0这个值，如果a字段值不为null，则显示a本来的值。如果a字段值为null，那么null转化为0这个值，如果a字段值不为null，则转化为1这个值。null没有被分配任何值或对象，表示这个字段没有被赋值或者值是未知的；将a字段的空值替换为1（[\\s]+|

overfit同步小助手 2023-11-15 08:03:51 0 收藏

hive 动态分区-动态分区数量太多也会导致效率下降&只设置非严格模式也能执行动态分区

百亿数据动态分区处理

overfit同步小助手 2023-11-15 05:03:10 0 收藏

Hive On Spark 概述、安装配置、计算引擎更换、应用、异常解决

overfit同步小助手 2023-11-14 23:03:48 0 收藏

Hive 的权限管理

hive自身支持三种权限管理模型，默认情况下是不开启的，这样会导致所有的用户都具有相同的权限，且默认都是超级管理员，超管对hive中的所有表都有查看和改动的权利，这样是不符合一般数据仓库的安全原则的，今天我们就来探究下Hive的权限管理

overfit同步小助手 2023-11-14 18:03:23 0 收藏