大数据 Hive - overfit.cn

使用 Apache Flink 从 Hive 批量加载数据到 HBase

通过上述步骤，我们实现了从 Hive 数据到 HBase 的批量加载过程。这种方法不仅高效，而且能够处理大规模数据。希望这篇博客对你理解和应用 Flink 和 HBase 有所帮助。如果有任何问题，欢迎留言讨论。

overfit同步小助手 2024-07-04 10:03:43 0 收藏

【hive】lateral view侧视图

lateral view也叫侧视图，属于hive sql所特有的语法。用来实现类似标准sql中join的操作。join参与运算的往往是两个表，根据指定的关联字段进行横向连接。lateral view参与运算的是一张表，这张表里往往存在某个多值的字段，通过侧视图结合UDTF函数可以将这个多值字段拆分为

overfit同步小助手 2024-07-04 05:03:46 0 收藏

大数据开发之Hive（统计影音视频网站的常规指标）

1、视频表2、用户表。

overfit同步小助手 2024-07-04 05:03:42 0 收藏

Hadoop 3.3.6 + Tez 0.10.3 + Hive 4.0.0 安装指南

根据 Hive 官方发布说明，Hive 4.0.0 兼容 Hadoop 3.3.6 和 Tez 0.10.3，尝试搭建了一套单节点的环境用于学习。

overfit同步小助手 2024-07-03 09:03:19 0 收藏

【Hive SQL 每日一题】统计指定范围内的有效下单用户

本题制作参考牛客网进阶题目 ——

overfit同步小助手 2024-07-03 04:03:36 0 收藏

Hadoop生态简介，Hive、Spark、HBase等

Hadoop生态全景介绍，Spark、Hive、HBase等

overfit同步小助手 2024-07-03 02:03:48 0 收藏

Hive-执行insert时报错或极其缓慢

背景：我是新手在跟着某硅谷学习hive的时候遇到这类问题，后来发现有两种方式解决；

overfit同步小助手 2024-07-02 11:03:49 0 收藏

面试专区|【70道Hive高频题整理(附答案背诵版)】

Hive是一个基于Hadoop的数据仓库工具，它可以将结构化的数据文件映射为一张数据库表，并提供简单的SQL查询功能，可以将SQL语句转换为MapReduce任务进行运行。Hive定义了简单的SQL查询语言称为HiveQL，该语言允许熟悉SQL的用户查询数据。同时，Hive提供了一个元数据存储，存储

overfit同步小助手 2024-07-02 05:03:41 0 收藏

Hive--删除数据库

删除一个空数据库，如果数据库下面有数据表，那么就会报错。强制删除数据库，包含数据库下面的表一起删除。

overfit同步小助手 2024-07-01 18:03:49 0 收藏

Hive期末总结

Hive总结

overfit同步小助手 2024-07-01 18:03:33 0 收藏

Spark与Hive的比较与优势

1.背景介绍1. 背景介绍Apache Spark和Hive都是大数据处理领域的重要工具。Spark是一个快速、高效的大数据处理框架，可以处理批量数据和流式数据。Hive则是一个基于Hadoop的数据仓库系统，可以处理大量结构化数据。在大数据处理领域，选择合适的工具是非常重要的。因此，了解Spark

overfit同步小助手 2024-07-01 15:03:18 0 收藏

centos7下Hadoop集群的mysql5.7以及hive3.1搭建——包对的！

centos7下Hadoop集群的mysql5.7以及hive3.1搭建

overfit同步小助手 2024-07-01 12:03:24 0 收藏

Hive on spark源码编译与调优

一般生产环境NN和RM吃资源少的会单独配置，而工作节点会单独配置资源较多，例如Master节点配置为16核CPU、64G内存；Workder节点配置为32核CPU、128G内存，五台服务器如下所示hadoop100hadoop101hadoop102hadoop103hadoop104masterm

overfit同步小助手 2024-07-01 02:03:13 0 收藏

小时候的子弹击中了现在的我-hive进阶：案例解析（第18天）

本文主要介绍hive的表操作，内外部表，分区分桶表，hive复杂类型，Hive乱码解决。

overfit同步小助手 2024-06-30 23:04:08 0 收藏

hive调优原理详解：案例解析参数配置(第17天）

本文主要详解hive调优，案例解析。

overfit同步小助手 2024-06-30 20:03:14 0 收藏

hive sql执行优化策略集合

mapred.min.split.size.per.node和mapred.min.split.size.per.rack含义是单节点和单机架上的最小split大小。set hive.exec.max.dynamic.partitions.pernode=1000 （默认1000）表示每个maper

overfit同步小助手 2024-06-30 19:03:50 0 收藏

【精】hadoop、HIVE大数据从0到1部署及应用实战

ETL，即数据抽取（Extract）、转换（Transform）和加载（Load）的过程，是数据仓库领域中的一个重要概念。简单来说，ETL过程就是从各种数据源中抽取数据，将这些数据按照一定的规则进行转换，并最终将这些数据加载到目标数据仓库或其他数据存储系统中。在ETL过程中，数据抽取阶段主要涉及到从

overfit同步小助手 2024-06-30 17:03:38 0 收藏

在Mac上安装Hive.4.0.0（M3：基于arm架构）

要先装好Hadoop，mysql哦！！jdk也自己装好，要装1.8的。由于M系列芯片使用的是arm架构所以，在mac使用brew下载的hive会报错这里我直接去阿里镜像上下载下载这个带着bin的然后解压（在mac里面可以不用tar命令，直接点压缩包它自己会解压，然后把压缩包找个目录保存好，重命名ma

overfit同步小助手 2024-06-30 11:03:45 0 收藏

项目实践---Windows11中安装Zookeeper/Hadoop/Hive

Windows11中安装Hadoop/Hive

overfit同步小助手 2024-06-30 09:03:15 0 收藏

大数据技术Hadoop -- Hive的基本操作

（8）查询stocks表中收盘价(price_close)比开盘价(price_open)高得最多的那条记录的交易所(exchange)、股票代码(symbol)、日期(ymd)、收盘价、开盘价及二者差价。（4）创建一个未分区的外部表dividends_unpartitioned，并从divide

overfit同步小助手 2024-06-30 07:03:49 0 收藏