Hive - overfit.cn

被CTO推荐的SQL总结

写SQL很多年后，做的小总结

overfit同步小助手 2023-05-01 21:03:32 0 收藏

Hive学习——单机版Hive的安装

overfit同步小助手 2023-05-01 05:04:02 0 收藏

Hive安装配置详解（提供实验平台）

文中涉及的 Hive 配置建立在已有 Hadoop 环境的基础上，进入实验平台提供的环境启动即可无需自行搭建

overfit同步小助手 2023-05-01 01:03:37 0 收藏

hive表加载csv格式数据或者json格式数据

先说第二行数据a,b,c,,,,,d 这个我确实是解决不了。但是换种思路，csv不是说分割符一定就是,也可以是其他符号比如@，那么a@b@c,,,,,d ，这种对于csvreader来说不就是小菜一碟。就是逃逸字符的下一个字符逃跑了。a,b,ab"cd" --其中这种很简单因为是根据,分割的所

overfit同步小助手 2023-04-30 22:03:37 0 收藏

Hive SQL 五大经典面试题

第 1 题连续问题第 2 题分组问题第 3 题间隔连续问题第 4 题打折日期交叉问题第 5 题同时在线问题

overfit同步小助手 2023-04-29 21:04:07 0 收藏

大数据技术之Hive

Hive：由Facebook开源用于解决海量结构化日志的数据统计工具。Hive是基于Hadoop的一个数据仓库工具，将结构化的数据文件映射为一张表，并提供类SQL(HQL)查询功能。1）用户接口：ClientJDBC/ODBC(jdbc访问hive)、2）元数据：Metastore元数据包括：表名、

overfit同步小助手 2023-04-29 21:03:41 0 收藏

Hive行列转换

1.多行转多列姓名(name)学科(subject)成绩(score)A语文70A数学80A英语90B语文75B数学85B英语95行列转换思路分析及实现多行转多列如果需要将上⾯的样例表转换为姓名 | 语⽂成绩 | 数学成绩 | 英语成绩这样的格式，就是多行转多列思路：涉及到行转成列，肯定是会按照某

overfit同步小助手 2023-04-29 19:03:49 0 收藏

HIVE 表 DLL 基本操作（一）——第1关：Create/Alter/Drop 数据库

为了完成本关任务，你需要掌握： 1.如何创建数据库；2.如何修改数据库；3.如何删除数据库。补充完代码后，点击测评，平台会对你编写的代码进行测试，当你的结果与预期输出一致时，即为通过。命令用于设定当前所有数据库对象操作所处的工作数据库，类似于。数据库本质上是一个目录或命名空间，用于解决表命名冲突。按

overfit同步小助手 2023-04-29 16:03:43 0 收藏

2、Hive：启动Hive

Hive：启动Hive

overfit同步小助手 2023-04-29 09:03:48 0 收藏

hive只复制表结构不复制表数据

hive

overfit同步小助手 2023-04-29 07:03:36 0 收藏

Hive（完整版）

大数据-Hive（完整版）

overfit同步小助手 2023-04-28 23:04:05 0 收藏

【数据库-Hive-01】hive为什么不支持更新和删除，一起找找根源

Hive支持更新和删除吗？这是一道典型的大数据面试题，绝大部分人回答不支持。其实也没错，但是更准确的回答是可以支持，主要是看怎么建表的，如果想要支持Update功能要按以下方式建表：Hive对使用Update功能的表有特定的语法要求, 语法要求如下... 为什么设计成不支持内，我们一起聊聊根源...

overfit同步小助手 2023-04-27 19:03:42 0 收藏

使用 Spark 抽取 MySQL 数据到 Hive 时某列字段值出现异常（字段错位）

在问题复现这里我们可以很容易的发现问题产生的原因，在实际开发中字段特别多，而且不一定每个字段都会使用到，我这里是因为使用了发生错误的字段，所以才发现了这个问题，提醒各位在建表时需要格外注意指定的字段分隔符。可以通过上下文对比轻松发现问题，数据抽取完成后，字段值出现了异常，那么为什么会这样呢？中的逗号

overfit同步小助手 2023-04-27 09:03:50 0 收藏

FlinkSQL消费Kafka写入Hive表

flinkSQL消费kafka实时写入hive表

overfit同步小助手 2023-04-27 05:03:49 0 收藏

Hudi系列15:Hudi元数据同步到Hive

Hudi元数据同步到Hive

overfit同步小助手 2023-04-26 22:03:49 0 收藏

大数据项目实战之数据仓库：用户行为采集平台——第2章项目需求及架构设计

overfit同步小助手 2023-04-26 18:04:08 0 收藏

大数据--python远程连接Hive

步骤：启动metastore启动hiveserver2使用beeline进行连接测试，查看地址等是否能够成功连接(确认无误可以跳过)使用python连接hive(粗暴的文件配置以及完整操作见文末)一.启动hiveserver21.配置mode为http，端口为10001(默认)<propert

overfit同步小助手 2023-04-26 17:03:43 0 收藏

spark插入动态分区代码报错

config("hive.metastore.dml.events","false") 就好了。windows确实好了。.config("hive.exec.dynamic.partition.mode", "nonstrict")//动态分区。.config("hive.metastore.dml

overfit同步小助手 2023-04-26 11:03:44 0 收藏

使用sqoop将hive数据库导入至mysql

overfit同步小助手 2023-04-26 01:03:42 0 收藏

Hive概论、架构和基本操作

Apache Spark是一个快速的，多用途的集群计算系统，相对于Hadoop MapReduce将中间结果保存在磁盘中，Spark使用了内存保存中间结果，能在数据尚未写入硬盘时在内存中进行计算，同时Spark提供SQL支持。Hive是建立在Hadoop上的数据仓库基础架构，它提供了一系列的工具，可

overfit同步小助手 2023-04-25 06:04:01 0 收藏