大数据 Hive - overfit.cn

【hive】hive中将string数据转为bigint的操作

【代码】【hive】hive中将string数据转为bigint的操作。

overfit同步小助手 2023-08-22 08:04:18 0 收藏

【Hive】分隔符『单字节分隔符 | 多字节分隔符』

1. 概述2. 单字节分隔符方法：使用delimited关键字3. 其它复杂情况方式一：写MR程序进行字符替换转为单字节分隔符问题（不推荐）方式二：自定义InputFormat转为单字节分隔符问题（不推荐）方式三：使用serde关键字（推荐）

overfit同步小助手 2023-08-22 05:04:10 0 收藏

Hive常见面试题

Hive是一个基于Hadoop生态系统的数据仓库和数据处理工具。它提供了类似于SQL的查询语言（HiveQL），使用户能够使用SQL语句来查询和分析大规模存储在Hadoop集群上的数据。Hive的主要作用是将大数据的处理变得更加易于理解和使用，尤其适合那些熟悉SQL查询语言的非技术用户。Hive

overfit同步小助手 2023-08-22 04:04:18 0 收藏

hive on spark亲自编译，详细教程

编译的spark目录下面的jars文件全部copy到hive/lib下面，将所有的hive/lib jar上传到hdfs目录:hdfs://master:9000/spark-jars/。2、下载spark-2.0.0的源码. https://archive.apache.org/dist/spar

overfit同步小助手 2023-08-21 00:04:30 0 收藏

【Hive】grouping sets() 函数

1. 语法2. 例子

overfit同步小助手 2023-08-19 19:05:11 0 收藏

spring boot 引入hive

可以从Spring容器中自动注入。在这个例子中，使用Hive的。指定Hive的元数据服务地址。指定HDFS的地址，

overfit同步小助手 2023-08-19 06:03:44 0 收藏

hive启动命令

1、启动元数据管理服务（必须启动，否则无法工作）前台启动：bin/hive --service metastore后台启动：nohup bin/hive --service metastore >> logs/metastore.log 2>&1 &2、启动客户端Hive Shell方式（可以直接写

overfit同步小助手 2023-08-19 03:04:36 0 收藏

Windows下安装Hive（包安装成功）

Hive 的Hive_x.x.x_bin.tar.gz 高版本在windows 环境中缺少 Hive的执行文件和运行程序。配置文件目录（%HIVE_HOME%\conf）有4个默认的配置文件模板拷贝成新的文件名。可以发现，自动连接MySQL去创建schema hive，并执行脚本。可以通过访问nam

overfit同步小助手 2023-08-18 21:04:20 0 收藏

Hive之lead函数详解

根据chatgpt生成的回答

overfit同步小助手 2023-08-17 23:04:21 0 收藏

【HiveSQL】定义变量&使用变量

HiveSQL中变量的定义与使用

overfit同步小助手 2023-08-17 13:04:25 0 收藏

Hive的堵塞问题和表锁问题原因查找

当一个用户或任务需要对表进行修改（如插入、更新、删除等操作）时，Hive会自动获取一个表级锁，以防止其他用户或任务同时修改该表。排他锁适用于对表进行写操作，当一个用户或任务获取到了一个表的排他锁时，其他用户或任务将无法修改该表。如果一个用户或任务需要对表进行修改，但另一个用户或任务已经获取了表的锁，

overfit同步小助手 2023-08-17 08:04:03 0 收藏

Hive常见错误及解决办法

overfit同步小助手 2023-08-15 20:04:25 0 收藏

了解hive on spark和spark on hive

大数据刚出来的时候，并不是很完善。发展的不是很快，尤其是在计算服务上，当时使用的是第一代mr计算引擎，相对来说计算并不是那么快。让大数据快速发展的是2009年伯克利大学诞生的spark，并在2013年成为Aparch的顶级开源项目。使大数据发展比较迅速、但是随着spark的快速发展，对于不太会用sp

overfit同步小助手 2023-08-15 11:04:01 0 收藏

清空hive表姿势大全

- 清空分区表为什么着重强调分区表,因为分区表清空可能会因为分区过多导致清理速度特别慢.

overfit同步小助手 2023-08-15 07:03:52 0 收藏

Hadoop集成Hive

说明：服务器已用主机名代替，可根据自己的需求，改为IP地址环境1、java版本1.82、Rsync CentOS中默认存在3、zstd、openssl、autoconf、automake、libtool、ca-certificates安装4、ISA-L5、nasm与yasm6、ssh7、hadoop

overfit同步小助手 2023-08-14 19:04:04 0 收藏

hive存储压缩格式对比说明

hive压缩说明

overfit同步小助手 2023-08-13 08:05:06 0 收藏

Hive-数据倾斜

在计算各省份的GMV时，有可能会发生数据倾斜，解决办法如下：

overfit同步小助手 2023-08-13 06:04:22 0 收藏

hive 全量表、增量表、快照表、切片表和拉链表

切片表根据基础表，往往只反映某一个维度的相应数据。其表结构与基础表结构相同，但数据往往只有某一维度，或者某一个事实条件的数据。：记录每条信息的生命周期，当一条记录的生命周期结束，就会重新开始一条新的记录，并把当前日期放入生效开始日期。3）合并变动数据和旧拉链表数据（有更新的信息需要修改生效结束日期，

overfit同步小助手 2023-08-13 02:04:21 0 收藏

Presto、Spark 和 Hive 即席查询性能对比

Spark 则是一个基于内存的分布式计算框架，可以快速地处理大规模的数据，并且具有很高的可扩展性。Presto 可以很容易地集成到现有的数据架构中，并且可以在不同的数据源之间进行无缝的查询。它们都具有各自的优缺点，在不同的场景下都有着不同的应用价值。Spark 是一个基于内存的分布式计算框架，它可以

overfit同步小助手 2023-08-12 20:04:39 0 收藏

Hive数据仓库

数仓作为面相分析的数据平台，其主职工作就是对存储在其中的数据开展分析，那么如何读取数据分析呢？理论上来说，任何一款编程语言只要具备读写数据、处理数据的能力，都可以用于数仓的开发。比如大家耳熟能详的C、java、Python等；关键在于编程语言是否易学、好用、功能是否强大。遗憾的是上面所列出的C、py

overfit同步小助手 2023-08-12 05:03:59 0 收藏