大数据 Hive - overfit.cn

深入解析《企业级数据架构》：HDFS、Yarn、Hive、HBase与Spark的核心应用

overfit同步小助手 2024-03-29 09:03:20 0 收藏

hive窗口函数学习总结

Hive中的窗口函数主要用于在数据集的子集（窗口）上执行计算。窗口函数可以解决一些复杂的数据分析问题，例如计算移动平均值、累计和、排名等。例如，如果你想要计算每个用户的购买总额排名，或者计算每个月的销售额是前三个月的平均值的多少倍，这些问题都可以通过窗口函数来解决。窗口函数的主要特点是可以在不改变原

overfit同步小助手 2024-03-28 18:03:42 0 收藏

Hive_last_value()

函数是一个窗口函数，用于返回窗口内的最后一个值。在同一分区内，窗口函数将独立计算每个分区。表示基于指定的列或表达式对行进行排序，这对于定义“最后”是基于什么顺序很重要。，它可能不会返回期望的结果。为了确保能够得到分区内所有行的最后一个值，可以使用。两列，以下SQL语句将返回每个分区（在本例中为每个日

overfit同步小助手 2024-03-28 16:03:40 0 收藏

Hive中的explode函数、posexplode函数与later view函数

在离线数仓处理通过HQL业务数据时，经常会遇到行转列或者列转行之类的操作，就像concat_ws之类的函数被广泛使用，今天这个也是经常要使用的拓展方法。

overfit同步小助手 2024-03-28 14:03:48 0 收藏

【SQL相关】Hive行列字符串的合并与拆分

Hive行列字符串的合并与拆分。

overfit同步小助手 2024-03-28 03:03:49 0 收藏

Hive日期函数应用之月份差值计算

一个常见的方法是首先将日期转换为 Unix 时间戳（如果它们还不是的话），然后通过计算时间戳之间的差值，并将这个差值转换为月份。然而，这种方法并不总是准确的，因为它假设每个月都有相同的天数（30或31天），而实际上不同月份的天数是不同的。或其他适当的函数来将它们转换为日期类型，或者确保它们是以 Hi

overfit同步小助手 2024-03-27 20:03:41 0 收藏

Java实现自定义Hive认证账户密码

overfit同步小助手 2024-03-27 08:03:29 0 收藏

Hive的时间操作函数

hive 里面的时间函数有很多，今天单讲dayofweek函数，背景：有时候不仅要出日报，还要出周报，需要很多天归为同一周，求sum或者均值；在Hive中，可以使用dayofweek()函数来计算某个日期是一周的第几天。其中，date表示要计算的日期，可以是一个日期字符串或者一个日期类型的列名。da

overfit同步小助手 2024-03-26 09:03:24 0 收藏

hive sql 和 spark sql的区别

总体而言，Spark SQL 在性能和灵活性上相对于 Hive SQL 有一些优势，特别是在需要处理实时数据或采用交互式查询的场景中。然而，选择使用哪个工具还取决于具体的业务需求、数据规模和现有的基础设施。Hive Metastore 或其他元数据管理工具。

overfit同步小助手 2024-03-25 22:03:19 0 收藏

Hive拉链表设计、实现、总结

拉链表的设计思路，如何制作，实践踩坑......

overfit同步小助手 2024-03-25 18:03:28 0 收藏

CloudCanal x Hive 构建高效的实时数仓

CloudCanal 最近对于全周期数据流动进行了初步探索，打通了Hive 目标端的实时同步，为实时数仓的构建提供了支持，这篇文章简要做下分享。

overfit同步小助手 2024-03-25 07:03:43 0 收藏

HIVE搭建教程

拷贝master安装包到beeline客户端机器上（任意一个节点即可）

overfit同步小助手 2024-03-24 20:03:33 0 收藏

数据仓库hive的安装说明

在hive-env.sh文件中加入下列配置信息： export JAVA_HOME=/usr/lib/jvm/jdk1.8.0_231。# 不重启mysql服务而使修改的内容直接生效。写入下列信息： export HIVE_HOME=/usr/local/hive。将bind-address

overfit同步小助手 2024-03-24 07:03:41 0 收藏

大数据系统开发综合实验（二）Hive_MySQL_Sqoop配置

mysql默认只允许root帐户在本地登录，想要远程连接mysql，必须开启root用户允许远程连接，或者添加一个允许远程连接的帐户。服务启动脚本： /usr/lib/systemd/system/mysqld.service。#如果只显示jps，则表示未启动，如果显示下图，则表示hadoop已经启

overfit同步小助手 2024-03-24 01:03:12 0 收藏

有关Hive对数据库的常见操作(二)

分桶和分区一样，也是一种通过改变表的存储模式，从而完成对表优化的一种调优方式但和分区不同，分区是将表拆分到不同的子文件夹中进行存储，而分桶是将表拆分到固定数量的不同文件中进行存储。需要map字段之间的分隔符："#"；struct类型是一个复合类型，可以在一个列中存入多个子列，每个子列允许设置类型和

overfit同步小助手 2024-03-23 11:03:38 0 收藏

【程序员必知必会3】ClickHouse和Hive究竟哪些区别

ClickHouse和Hive都是用于大数据处理和分析的分布式存储和计算系统，但它们之间存在一些区别：架构：ClickHouse采用列式存储和向量化执行引擎，可以实现亚秒级别的数据查询。而Hive采用基于Hadoop的数据存储和MapReduce计算引擎，数据查询速度相对较慢。查询语言：ClickH

overfit同步小助手 2024-03-23 05:03:42 0 收藏

第二章 hive环境配置

rw-r--r--. 1 root root 609556480 3 月 21 15:41 mysql-5.7.28- 1.el7.x86_64.rpm-bundle.tar。libaio.so.1(LIBAIO_0.1)(64bit) 被 mysql-community-server-5.7.28

overfit同步小助手 2024-03-23 03:03:40 0 收藏

（头哥）Hive的安装与配置

(必须在第一关基础上执行）

overfit同步小助手 2024-03-23 00:03:23 0 收藏

superset连接Apache Spark SQL（hive）过程中的各种报错解决

overfit同步小助手 2024-03-22 13:03:39 0 收藏

Hive 2.3.0 安装部署（mysql 8.0）

hive mysql centos7安装

overfit同步小助手 2024-03-22 10:04:32 0 收藏