大数据 Hive - overfit.cn

Servlet详解（超详细）

（保姆级教学）本文从Servlet的概念，使用，生命周期三个大点来详细理解Servlet。其内还含有需要注意的点，相关经验，小tips等等。

overfit同步小助手 2024-09-06 04:03:36 0 收藏

hive 基本语法

*不会在HDFS对数据库所在目录进行改名，只是修改location后，新创建的表在新的路径，旧的不变**虚拟列是Hive内置的可以在查询语句中使用的特殊标记，可以查询数据本身的详细参数。**分桶表无法使用LOAD DATA进行数据加载****分区所在的HDFS文件夹依旧保留**将其它表数据，加载到目

overfit同步小助手 2024-09-05 08:03:52 0 收藏

Hbase、hive以及ClickHouse的介绍和区别？

HBase、Hive以及ClickHouse是三种在大数据领域广泛使用的数据库系统，它们各自具有独特的特点和适用场景。

overfit同步小助手 2024-09-05 02:03:42 0 收藏

超细学学 lateral view (侧视图) + explode 炸裂函数 + 日期数据补全

lateral view (侧视图) + explode 炸裂函数 + 日期数据补全

overfit同步小助手 2024-09-04 04:03:24 0 收藏

【Hive SQL 每日一题】找出各个商品销售额的中位数

子查询中可以看到，如果总个数为奇数时，那么该组中的中位数有且仅有一个，因为它无论时正序还是逆序排列，中位数的排名都不会发生改变，这种情况时，那么是不是满足条件。这两个函数无法严格的计算出中位数，它们计算的只是一个近似值，意味着和真正的中位数是存在一定差异的，特别是在数据量较少或数据分布不均的情况下。

overfit同步小助手 2024-09-04 00:03:50 0 收藏

hive sql 处理多层 json 数组

通过 hive sql，展开包含多层 json 数组的字符串，然后获取到每个子 json 中的值。

overfit同步小助手 2024-09-03 04:03:57 0 收藏

Hive数仓总结

数据仓库(Data Warehouse)，简称DW。数据仓库顾名思义，是⼀个很⼤的数据存储集合，出于企业的分析性报告和决策⽀持⽬的⽽创建，对多样的业务数据进⾏筛选与整合。它为企业提供⼀定的BI（商业智能）能⼒，指导业务流程改进。 Hive是Facebook为了解决海量日志数据的统计分析而开发的基于H

overfit同步小助手 2024-09-03 04:03:54 0 收藏

Hive SQL

tinyint 1byte 有符号整数smallint 2byte 有符号整数int 4byte 有符号整数bigint 8byte 有符号整数boolean 布尔类型，true或者falsefloat

overfit同步小助手 2024-09-02 13:03:45 0 收藏

【Linux】—Apache Hive 安装部署

本文主要介绍在Linux环境下安装Hive的过程。

overfit同步小助手 2024-09-02 04:03:31 0 收藏

Linux系统下虚拟机中安装（搭建）hive的详细教程

前面，我们已经在虚拟机中安装配置了linux，接下来我们将在虚拟机中安装hive。一、安装hive压缩包1、启动虚拟机①打开VMware、MobaXterm，启动虚拟机集群；②上传hive的tar压缩包至linux系统下目录（仍然为单节点安装，同样在第一台虚拟机上安装）2、安装hive①进入hi

overfit同步小助手 2024-09-02 03:03:31 0 收藏

数据人，需要了解的数据要素、数据资产、数据治理、数据产品、数据共享、主数据、元数据

一文略讲数据要素、数据资产、数据治理、数据产品、数据共享、主数据、元数据

overfit同步小助手 2024-09-01 20:03:53 0 收藏

使用beeline连接hive

使用beeline连接hive的前提是hive已经部署完毕，Hive单机部署可以看：http://t.csdnimg.cn/54WMQ。

overfit同步小助手 2024-09-01 02:03:33 0 收藏

离线数仓之Hive的基础操作

hive是基于Hadoop的一个数据仓库工具，用来进行数据提取、转化、加载，这是一种可以存储、查询和分析存储在Hadoop中的大规模数据的机制。hive数据仓库工具能将结构化的数据文件映射为一张数据库表，并提供SQL查询功能，能将SQL语句转变成MapReduce任务来执行。Hive的优点是学习成本

overfit同步小助手 2024-08-31 20:03:51 0 收藏

Hive的优化大全,超过16种优化,详细篇,附带mysql数据库的优化

hive的十六种优化的原理和代码; mysql的优化方式介绍

overfit同步小助手 2024-08-30 14:03:43 0 收藏

三、系统隔离术——基于Servlet 3实现请求隔离

特别是在像京东这样的大型电商平台中，商品详情页系统及相关的服务，如库存服务、图书相关服务、延保服务等，都需要处理大量的并发请求。在传统的请求处理模型中，所有请求处理操作都在一个线程中完成，包括请求解析、业务处理和响应生成。例如上图，Tomcat 6 在处理请求时需要在一个线程中完成所有的操作，这种处

overfit同步小助手 2024-08-29 16:04:04 0 收藏

hive数据采集零点漂移

这个时候数据写入的目录就和系统时间有关系。解决方案是采用自定义flume的拦截器，将数据中的事件时间(也就是数据生成的实际时间)解析出来，存储到headers里面，key是timestamp，value是解析出来的事件时间，将useLocalTimeStamp配置为false，最终数据就会写入事

overfit同步小助手 2024-08-29 01:03:45 0 收藏

Hive-3.1.3远程模式安装与配置

Hive-3.1.3的安装与配置

overfit同步小助手 2024-08-28 03:03:23 0 收藏

Hadoop安装Hive

如果以上步骤都能成功运行，说明 Hive 安装和配置完成，可以开始使用 Hive 进行大数据分析了。确保你的系统已经安装了 Java JDK（推荐使用 JDK 1.8 版本）。如果还没有安装 Hadoop，可以参考以下简要步骤安装 Hadoop。将 Hadoop 目录移动到合适的位置（例如。将 Hi

overfit同步小助手 2024-08-27 17:04:12 0 收藏

Hive 中的 SPLIT、COALESCE 及 COLLECT_LIST 函数的用法

SPLITstr：要拆分的字符串。delimiter：用于拆分的分隔符。COALESCE：一组值，COALESCE将返回第一个非空值。expr：要收集的表达式。Hive 提供的SPLITCOALESCE和函数是数据处理和分析中非常有用的工具。它们可以帮助用户高效地处理字符串、管理空值，以及聚合数据。

overfit同步小助手 2024-08-27 11:04:00 0 收藏

基于大数据爬虫+hive+数据可视化大屏的网络电视剧收视率分析与可视化平台设计和实现(源码+LW+部署讲解)

基于Hive的网络电视剧收视率分析系统是一个高效、精确的数据管理与分析平台，旨在为电视传媒机构和观众提供一个全面的收视率数据解决方案。通过利用Hive的大数据处理能力，该系统能够存储和分析海量的收视数据，从而揭示不同电视剧的受欢迎程度和观众偏好。管理员可以通过系统管理模块轻松地更新用户信息、发布公告

overfit同步小助手 2024-08-27 08:03:25 0 收藏