大数据 Hive - overfit.cn

Hadoop架构、Hive相关知识点及Hive执行流程

overfit同步小助手 2023-12-23 22:03:49 0 收藏

Hive 定义变量变量赋值引用变量

hive --define slogan=勿忘国耻set hivevar:slogan=铭记历史;

overfit同步小助手 2023-12-23 20:03:39 0 收藏

idea连接hive

在hadoop平台写hive命令容易出错，但在idea中写hive命令可以提示代码，代码写错还可以提示错误，所以选择在idea中写hive命令。1.在idea中构建一个maven项目，引入相关依赖，并且相关依赖版本号与hive，hadoop的版本号一致。实验环境hadoop2.8.3

overfit同步小助手 2023-12-23 19:03:22 0 收藏

毕设：《基于hive的音乐数据分析系统的设计与实现》

dd

overfit同步小助手 2023-12-23 18:03:48 0 收藏

Hive case when 用法详细介绍

在上面的示例中，如果客户的收入大于100,000，则他们被分为“高”收入。如果他们的收入在50,000和100,000之间，则被归类为“中等”收入。在此示例中，如果年龄小于18岁，则将用户归类为“未成年”；例如，假设我们有一个包含客户信息的表，我们想根据客户的收入水平将其分类为高收入，中等收入和低收

overfit同步小助手 2023-12-23 16:03:41 0 收藏

大数据HIVE篇--控制hive任务中的map数和reduce数

空置Map和Reduce的个数

overfit同步小助手 2023-12-23 06:03:12 0 收藏

在 docker 中快速启动 Apache Hive

在伪分布式模式下，在Docker容器内运行Apache Hive，可以提供以下功能：快速启动/调试/为Hive准备测试环境。

overfit同步小助手 2023-12-23 02:03:35 0 收藏

Hivesql解析多层Json数据

Hivesql解析多层json

overfit同步小助手 2023-12-22 09:03:44 0 收藏

Hive Delegation Token 揭秘

本篇文章是由一次 Hive 集群生产优化而引出的知识点，供大家参考。

overfit同步小助手 2023-12-21 20:03:34 0 收藏

【Hive】配置

2.5

overfit同步小助手 2023-12-20 18:03:35 0 收藏

Hadoop历险记（七 Hive配置和启动hiveservice2服务）

但是hive我们并没有每天机器都安装，我们只安装第一台机器，所以从安装角度说他是单机的，但是它为什么优势分布式查询呢？现在都强烈用新配置了，这里新配置由多了一个东西叫做HS2，新手觉得很sb，本来元数据外面套一个元数据服务，现在元数据服务外面还有再套一个HS2.理解配置文件是非常必要的，这个必要

overfit同步小助手 2023-12-20 16:03:53 0 收藏

运行hive语句时有很多info怎么消掉

每次启动hive和执行hive sql命令时都打印了很多没用的INFO日志，看起来很繁琐，那么该怎么消除掉这些没用的日志消息

overfit同步小助手 2023-12-20 16:03:48 0 收藏

DataGrip连接hive教程

虽然hive官方提供了两种的客户端，但是页面不友好、智能程度低，因此我们往往使用能够提供良好图形页面的第三方客户端。

overfit同步小助手 2023-12-20 11:03:40 0 收藏

Sqoop ---- Sqoop一些常用命令及参数

记录了 Sqoop job 的元数据信息，如果不启动该服务，那么默认 job 元数据的存储目录为~/.sqoop，可在 sqoop-site.xml 中修改。将关系型数据库中的数据导入到 HDFS（包括 Hive，HBase）中，如果导入的是 Hive，那么当 Hive 中没有对应表时，则自动创建。

overfit同步小助手 2023-12-20 06:03:45 0 收藏

【004hive基础】hive的文件存储格式与压缩

hive文件存储格式与压缩

overfit同步小助手 2023-12-19 05:03:41 0 收藏

【Spark数仓项目】需求八：MySQL的DataX全量导入和增量导入Hive

本需求将模拟从MySQL中向Hive数仓中导入数据，数据以时间分区。测试两种导入场景，一种是将数据全量导入，即包含所有时间分区；另一种是每天运行调度，仅导入当天时间分区中的用户数据。mysql表建表语句：hive注意字段时间戳，我们将从以上MySQL向Hive导入数据。编写datax的json脚本"

overfit同步小助手 2023-12-18 12:03:48 0 收藏

HIVE内表与外表的区别

hive内外表的区别，主要总结六点区别

overfit同步小助手 2023-12-18 11:03:16 0 收藏

Hive增强的聚合、多维数据集、分组和汇总

在多维分析场景下，我们可能会用到高阶聚合函数，例如CUBEROLLUP等。Hive、Spark、Presto等引擎都提供类似的高阶聚合函数，以对不同维度组合下的数据进行聚合统计Hive官方将这种分析称为GROUP BY子句增强的聚合、多维数据集、分组和汇总那么什么是增强聚合和多维分析呢？增强聚合是指

overfit同步小助手 2023-12-18 03:03:52 0 收藏

【SparkSQL】SparkSQL的运行流程 & Spark On Hive & 分布式SQL执行引擎

本文重点介绍、SparkSQL的运行流程、 SparkSQL的自动优化、Catalyst优化器、SparkSQL的执行流程、Spark On Hive原理配置、分布式SQL执行引擎概念、代码JDBC连接。

overfit同步小助手 2023-12-17 23:03:49 0 收藏

Hive 查询优化

set hive.exec.mode.local.auto=true;set mapperd.job.tracker=local;set mapreduce.framework.name=local;set hive.vectorized.execution.enabled=true;

overfit同步小助手 2023-12-17 02:03:54 0 收藏