大数据 Hive - overfit.cn

窗口函数简介与总结

窗口函数是 SQL 中一类特别的函数。和聚合函数相似，窗口函数的输入也是多行记录。不同的是，聚合函数的作用于由 GROUP BY 子句聚合的组，而窗口函数则作用于一个窗口，这里，窗口是由一个 OVER 子句定义的多行记录。聚合函数对其所作用的每一组记录输出一条结果，而窗口函数对其所作用的窗口

overfit同步小助手 2023-06-10 03:03:39 0 收藏

HIVE/SQL 实现同一列数据累加和累乘

以上是对数的一些运算性质，其中我重点圈出了两个性质，这将是我们使用 hive sql 实现同一列数据累乘的关键；1）左边的红框中，两个底数(a)相同的对数相加 = 以a为底(N*M)的对数，其中(N*M)就是我们想要的计算结果，应该如何获取(N*M)呢？2）看右边红框的性质，我们可以利用这个性质获取

overfit同步小助手 2023-06-09 14:03:41 0 收藏

hive数据仓库--Hive介绍

hive

overfit同步小助手 2023-06-09 07:03:42 0 收藏

HIVE总结

一：hive作用Hive是基于Hadoop的一个数据仓库工具，可以将结构化的数据文件映射为一张表，并提供类SQL查询功能。Hive本质：将HQL转化成MapReduce程序（1）Hive处理的数据存储在HDFS（2）Hive分析数据底层的实现是MapReduce（3）执行程序运行在Yarn上1.1：

overfit同步小助手 2023-06-08 17:03:42 0 收藏

基于Hadoop的项目实战-职位数据综合分析

一、数据采集（selenium）from selenium import webdriverimport timeimport reimport pandas as pdimport os在爬取的过程中可能会有登陆弹窗，要先定义一个处理弹窗的函数def close_windows(): #如果

overfit同步小助手 2023-06-08 07:03:49 0 收藏

hive表新增字段，指定新增字段位置，删除字段

经验证，hive中修改字段顺序并没有将字段对应的值移动，只是单纯的修改字段名，如果是空表（没有数据），可以使用以上两步；其中CASCADE选项为选填的字段，但是对于分区表，一定要加上，否则其历史分区的元数据信息(metadata)将无法正常更新，导致访问历史分区时会报莫名的错误。背景：项目中，客户使

overfit同步小助手 2023-06-08 06:03:50 0 收藏

hive表数据更新insert overwrite/merge into

根据甲方要求，需要对大数据平台指定表(hive、impala表)的历史数据[2021-01-01至2023-03-29]指定字段进行批量更新，然后把表同步到Oracle。hive有8张表更新，其中4张大表【分区表】（数据量分别为：1038738976、260958144、25860509、28670

overfit同步小助手 2023-06-08 04:03:34 0 收藏

docker快速部署hue+hue集成hive

首先需要安装hive，hive的安装在安装完成之后，使用脚本命令启动hdfs和hive的相关服务。

overfit同步小助手 2023-06-07 22:03:38 0 收藏

HIVE选择题总结

hive选择题总结

overfit同步小助手 2023-06-07 17:03:39 0 收藏

Hive 连接及使用

有三种方式连接 hive：cli：直接输入 bin/hive 就可以进入 clihiveserver2、beelinewebui

overfit同步小助手 2023-06-07 13:03:40 0 收藏

漫谈大数据 - HiveSQL总结（二）查询操作

导语：HiveSQL各关键字详解，hive函数大全，类似于个人记录工具书，后续遇到其他的也会继续加进来。

overfit同步小助手 2023-06-05 17:03:48 0 收藏

大数据面试八股文之 hive 篇

网上大数据开发工程师的面试题相对较少，且比较杂乱分散，有的甚至没有答案。为了广大数据人着想，总结了大数据面试题hive篇，并给出答案，希望能有所帮助。

overfit同步小助手 2023-06-04 12:03:42 0 收藏

大数据之Hadoop数据仓库Hive

Hive 是一个构建在 Hadoop 之上的数据仓库，它可以将结构化的数据文件映射成表，并提供类 SQL 查询功能，用于查询的 SQL 语句会被转化为 MapReduce 作业，然后提交到 Hadoop 上运行。简单、容易上手 (提供了类似 sql 的查询语言 hql)，使得精通 sql 但是不了解

overfit同步小助手 2023-06-03 04:03:35 0 收藏

Flutter教程之 Flutter 开发者的终极 Hive 数据库管理工具

这就是为什么我很高兴地宣布推出Flutter 的原因hive_ui，这是一个新的 Flutter 包，可以让您轻松管理 Hive 数据库。因此，如果您正在寻找一种管理 Hive 数据库的简单方法，请尝试使用 Hive UI，看看它如何帮助您更高效地工作。Hive UI 最好的事情之一是它是开源的并且

overfit同步小助手 2023-06-03 04:03:32 0 收藏

Ubuntu下搭建伪分布式从0开始安装Hive详细教程（从JDK安装、Hadoop搭建开始）

overfit同步小助手 2023-06-02 12:03:43 0 收藏

解决hive表中文乱码问题

hive字段名称和字段描述等存储进如hivemetastore是中文，查询出来也是???等无法识别的中文乱码；

overfit同步小助手 2023-06-02 12:03:36 0 收藏

Hive常用的日期函数

HiveSQL中较为常用的日期处理函数整理汇总

overfit同步小助手 2023-06-02 00:03:38 0 收藏

Hive合并小文件详解(参数介绍)

一、MR输出时合并小文件参数设置含义set hive.merge.mapfiles=true; 默认值ture,在Map-only的任务结束时合并小文件set hive.merge.mapredfiles=true; 默认值false,在Map-Reduce的任务结束时合并小文件set hive.

overfit同步小助手 2023-06-01 22:03:50 0 收藏

Hive的安装与配置详解

overfit同步小助手 2023-05-31 20:03:53 0 收藏

大数据项目实战-招聘网站职位分析

本项目是通过hadoop生态系统基于大数据离线处理技术完成的。利用HDFS存储数据、MapReduce做批量计算，将计算完成的数据存储在Hive数据仓库中。

overfit同步小助手 2023-05-30 14:04:26 0 收藏