大数据 Hive - overfit.cn

Hive/Spark小文件解决方案(企业级实战)–参数和SQL优化

Spark读取Hive数据或文件如何提升速度的优化思路

overfit同步小助手 2024-09-24 05:03:32 0 收藏

远程连接Hiveserver2服务

完成Hive本地模式安装后，可以启动hiveserver2服务进行远程连接和操作Hive。

overfit同步小助手 2024-09-23 23:03:43 0 收藏

【面试系列】Hive 高频面试题解答

本文介绍了 Hive 技术在初级、中级和高级面试中的常见问题及其详细解答。初级面试题集中于 Hive 的基础概念，如 Hive 架构、分区和分桶等。中级面试题探讨了 Hive 的查询优化技术、动态分区、UDF 和小文件处理问题。高级面试题则涵盖了 Hive 的 ACID 支持、物化视图、Tez 引擎

overfit同步小助手 2024-09-23 15:03:55 0 收藏

Hive Tutorial For Beginners

适合初学者的 Hive 导论~

overfit同步小助手 2024-09-23 08:03:31 0 收藏

二百六十六、Hive——Hive的DWD层数据清洗、清洗记录、数据修复、数据补全

Hive——Hive的DWD层数据清洗、清洗记录、数据修复、数据补全

overfit同步小助手 2024-09-22 20:03:45 0 收藏

Hive环境搭建（Mysql数据库）

在linux系统下，首先执行cd /simple 命令进入simple目录下，然后把/simple/soft目录下的hive压缩包解压到/simple目录下，执行命令为：tar -zxvf /simple/soft/hive-0.12.0.tar.gz。工具中默认使用的是derby数据库，该数据库

overfit同步小助手 2024-09-22 11:04:04 0 收藏

Hive建表语句详解及创建表时的分隔符使用

Hive 建表语句和分隔符的使用是 Hive 数据管理的重要组成部分。在创建表时，选择合适的分隔符对于正确解析和处理数据至关重要。通过详细了解 Hive 建表语句的各个组成部分和分隔符的使用方法，可以更好地管理和处理大数据集。本文通过多个实际案例和应用场景，介绍了如何创建内部表和外部表，如何选择和使

overfit同步小助手 2024-09-22 02:03:23 0 收藏

数据挖掘Centos Linux单机配置安装Hive

【代码】数据挖掘Centos Linux单机配置安装Hive。

overfit同步小助手 2024-09-21 21:03:28 0 收藏

11、Hive+Spark数仓环境准备

1）把hive-3.1.3.tar.gz上传到linux的/opt/software目录下2）解压hive-3.1.3.tar.gz到/opt/module/目录下面3）修改hive-3.1.3-bin.tar.gz的名称为hive4）修改/etc/profile.d/my_env.sh，添加环境变

overfit同步小助手 2024-09-21 20:03:36 0 收藏

Hive 判断某个字段长度

Hive内置函数是Hive提供的一组函数，用于在Hive SQL查询中进行数据处理、转换和分析。这些函数可以帮助用户更高效地处理数据，实现复杂的数据操作和计算。然后，通过Hive SQL查询语句筛选出了用户名长度大于等于5并且小于等于10的用户数据，以实现对用户数据的精确筛选。在Hive中，有时我们

overfit同步小助手 2024-09-21 04:03:48 0 收藏

day05-Hive语法补充

表名和字段的修改使用alter关键字。

overfit同步小助手 2024-09-20 04:03:25 0 收藏

拉链表和宽表的优劣势

是一种用于数据仓库的表结构，记录了数据随时间变化的历史状态。每次数据发生变化时，都会在拉链表中插入一条新记录，而旧记录保持不变，仅标记其有效时间区间。

overfit同步小助手 2024-09-20 01:03:52 0 收藏

Hive中的数据类型详解

Hive的数据类型是构建数据表、进行数据分析和查询的基础。了解Hive中各类数据类型的特点、使用场景和选择原则，有助于数据工程师和分析师在设计表结构时作出合理的决策。基本数据类型：包括数字、字符串、布尔、日期和时间类型，适用于存储最基本的数据。复杂数据类型：包括数组、结构体和映射，适用于存储更复杂和

overfit同步小助手 2024-09-19 02:03:47 0 收藏

HIVE大数据平台SQL优化分享

此文章是大数据平台运维组从多维度参数（CPU，内存，运行时长等）筛选出TOP任务，联合数据开发人员进行优化，最终出具优化方案优化跑批作业的业务逻辑，SQL逻辑等，并跟进方案落地和报告整理。

overfit同步小助手 2024-09-19 00:03:33 0 收藏

hive搭建 -----内嵌模式和本地模式

hive的搭建，常用的本地模式以及不常用的内嵌模式

overfit同步小助手 2024-09-18 17:03:36 0 收藏

学习大数据DAY56 业务理解和第一次接入

ERP 系统，（Enterprise Resource Planning，企业资源计划系统）：ERP 系统。OA 系统，（Office Automation System，办公自动化系统）：OA 系统是一种用。Parquet：这是另一种列存储格式，它旨在提供跨平台的文件格式，可以很好地。是一种用于管

overfit同步小助手 2024-09-18 14:03:44 0 收藏

hive入门

打开：命令提示符程序，输入mysql -uroot -p 回车查看数据库使用数据库use 数据库名称;创建数据库删除数据库查看当前使用的数据库查看当前use的数据库。

overfit同步小助手 2024-09-18 01:03:24 0 收藏

Hive SQL语言

在查询过程中执行顺序：from > where > group（含聚合）> having >order > select；LOCATION：指定数据库在HDFS存储位置，默认/user/hive/warehouse/dbname.db。2. where子句在查询过程中执行优先级别优先于聚合语句(su

overfit同步小助手 2024-09-17 13:03:44 0 收藏

Hive SQL基础语法及查询实践

查询出薪水大于1000的所有员工。典型的查询会返回多行数据。子句用于限制返回的行数。子句中不能使用字段别名。

overfit同步小助手 2024-09-17 11:03:52 0 收藏

超详细Python教程——Hive简介

Hive是 Facebook 开源的一款基于 Hadoop 的数据仓库工具，目前由 Apache 软件基金会维护，它是应用最广泛的大数据处理解决方案，它能将 SQL 查询转变为 MapReduce（Google提出的一个软件架构，用于大规模数据集的并行运算）任务，对 SQL 提供了完美的支持，能够非

overfit同步小助手 2024-09-17 01:03:46 0 收藏