大数据 Hive - overfit.cn

其中，Spark Executor内存是Spark配置中设置的executor总内存，包括堆内存和非堆内存。总内存 = Spark Executor内存 + Spark Executor的JVM堆内存 + Spark Executor的JVM非堆内存。1). 将/opt/module/spark/c

overfit同步小助手 2024-01-29 14:03:43 0 收藏

【大数据进阶第三阶段之Hive学习笔记】Hive安装

安装hadoop 以及 zookeeper、mysql《zookeeper的安装与配置》《Linux环境配置MySQL》

overfit同步小助手 2024-01-29 05:03:16 0 收藏

大数据-hive基本语法整理

hive基本语法一、hive建表语句create external table if not exists ods_base_org_info( id string comment '主键', org_code string comment

overfit同步小助手 2024-01-29 03:03:35 0 收藏

Hive实战：词频统计

通过这一系列的操作，我们深入学习了Hive的外部表创建、数据加载、查询、视图创建以及统计分析的操作。字段的内容按照空格分割成多个单词，并生成一个多行的结果集，每行包含一个单词。函数则将这个分割后的数组转换为多行记录，即每一行对应原字符串中的一个单词。统计每个单词分组的数量，结果将展示每个单词及其在原

overfit同步小助手 2024-01-29 03:03:23 0 收藏

8-Hive原理与技术

题目3：Hive分区字段不能与已存在字段重复，且分区字段是一个虚拟的字段，它不存放任何数据，该数据来源于装载分区表时所指定的数据文件。题目2：Sqoop是关系型数据库与Hadoop之间的数据桥梁，这个桥梁的重要组件是Sqoop连接器。题目3：Hive最重视的性能是可测量性、延展性、对于输入格式的宽松

overfit同步小助手 2024-01-29 01:03:54 0 收藏

大数据Hadoop教程-学习笔记06【Hadoop生态综合案例：陌陌聊天数据分析】

overfit同步小助手 2024-01-28 14:03:50 0 收藏

【DolphinScheduler】datax读取hive分区表时，空分区、分区无数据任务报错问题解决

【DolphinScheduler】datax读取hive分区表时，空分区、分区无数据任务报错问题解决。最近在使用海豚调度DolphinScheduler的Datax组件时，遇到这么一个问题：之前给客户使用海豚做的离线数仓的分层搭建，一直都运行好好的，过了个元旦，这几天突然在数仓做任务时报错

overfit同步小助手 2024-01-28 05:03:33 0 收藏

Hive外表创建和加载数据

由于我们的源数据目录没有显示的指定分区字段，因此建表的时候没有指定 location，通过 load data inpath 命令来装载数据。1、load data 命令会移动数据2、load data inpath … overwrite 命令使用不当会导致数据被覆盖。3、通过 alter tab

overfit同步小助手 2024-01-28 03:03:36 0 收藏

Hive csv文件导入Hive

【代码】Hive csv文件导入Hive。

overfit同步小助手 2024-01-28 01:03:43 0 收藏

Hive-SQL语法大全

]，表示可选，如上[LOCATION]表示可写、可不写，表示或，如上ASC | DESC，表示二选一…，表示序列，即未完结，如上表示在SELECT后可以跟多个，以逗号隔开()，表示必填，如上(A | B | C)表示此处必填，填入内容在A、B、C中三选一。

overfit同步小助手 2024-01-27 07:03:33 0 收藏

【Hive_03】单行函数、聚合函数、窗口函数、自定义函数、炸裂函数

Hive会将常用的逻辑封装成函数给用户进行使用，类似于Java中的函数。好处：避免用户反复写逻辑，可以直接拿来使用。重点：用户需要知道函数叫什么，能做什么。Hive提供了大量的内置函数，按照其特点可大致分为如下几类：单行函数、聚合函数、炸裂函数、窗口函数。以下命令可用于查询所有内置函数的相关信息。1

overfit同步小助手 2024-01-26 20:03:48 0 收藏

HiveSQL基础命令02

分区是针对文件夹（内部文件例如.txt也会被分），原理和SQL的group by类似,是将原表中一个或多个文件，通过给新字段对应原表字段分区，分成多个文件夹存放文件，存放到分区表中，这样在扫描特定文件（以分区字段来查询）的时候不需要全盘扫描。3. 分桶规则用的是: 哈希取模分桶法, 简单来说, 就是

overfit同步小助手 2024-01-26 20:03:35 0 收藏

任务15：使用Hive进行全国气象数据分析

任务描述任务指导。

overfit同步小助手 2024-01-25 20:03:51 0 收藏

分布式数据库·Hive和MySQL的安装与配置

Apache Hive 简介

Hive实战：词频统计

Hive09_函数

Hive运算符和函数

【SparkSQL】基础入门（重点：SparkSQL和Hive的异同、SparkSQL数据抽象）

【数据仓库与联机分析处理】数据仓库工具Hive

关于hive on spark部署后insert报错Error code 30041问题

【大数据进阶第三阶段之Hive学习笔记】Hive安装

大数据-hive基本语法整理

Hive实战：词频统计

8-Hive原理与技术

大数据Hadoop教程-学习笔记06【Hadoop生态综合案例：陌陌聊天数据分析】

【DolphinScheduler】datax读取hive分区表时，空分区、分区无数据任务报错问题解决

Hive外表创建和加载数据

Hive csv文件导入Hive

Hive-SQL语法大全

【Hive_03】单行函数、聚合函数、窗口函数、自定义函数、炸裂函数

HiveSQL基础命令02

任务15：使用Hive进行全国气象数据分析

作者榜

资讯小助手

内容小助手

Deephub

奕凯