大数据 Hive - overfit.cn

Hive报错org.apache.hadoop.hive.ql.exec.mr.MapredLocalTask

org.apache.hadoop.hive.ql.exec.mr.MapredLocalTask

overfit同步小助手 2023-07-07 14:04:49 0 收藏

SQL 经典面试题：统计最近七天连续三天活跃的用户

给定 mid，dt 的用户登录记录表，查找最近 7 天内连续 3 天活跃的用户 id，实现思路：获取最近 7 天的用户登录记录数据（在 where 中限定），对数据进行 rank 排序...

overfit同步小助手 2023-07-07 11:04:35 0 收藏

Dbeaver连接Hive数据库操作指导

由于工作需要，当前分析研究的数据基于Hadoop的Hive数据库中，且Hadoop服务端无权限进行操作且使用安全模式，在研究了Dbeaver、Squirrel和Hue三种连接Hive的工具，在无法绕开useKey认证的情况下，只能使用DBeaver工具进行远程连接。

overfit同步小助手 2023-07-07 11:04:32 0 收藏

Hive数据表删除数据操作

overfit同步小助手 2023-07-07 10:04:19 0 收藏

sqoop把hive中的数据导入mysql

使用sqoop将hive中的数据导入mysql中记录简单案例首先开启集群：start-all.sh在hive中建库建表，并插入一条数据来为自己做实验：验证一下，是否插入成功：在mysql中建表，并且要与hive中传过来的数据字段相对应：建表后为空：用sqoop将hive中的数据传到mysql中：ex

overfit同步小助手 2023-07-07 05:04:19 0 收藏

hive中日期和字符串的转换

hive中日期和字符串之间的转换

overfit同步小助手 2023-07-06 15:04:08 0 收藏

hive--执行计划

来聊一聊执行计划，如果掌握了MapReduce，且开发者有一定的经验积累可以反推Compiler将SQL转换的MapReduce执行算法，并借助explain来比对你构思的执行计划和实际生成的执行计划是否存在差异，并思考差异的原因是啥，慢慢就能够对生成的算法以及算法执行路径图是否合理给出一个自己的评

overfit同步小助手 2023-07-06 11:04:18 0 收藏

Hive入门详解操作

FaceBook网站每天产生海量的结构化日志数据，为了对这些数据进行管理，并且因为机器学习的需求，产生了hive这门技术，并继续发展成为一个成功的Apache项目。hive是一个构建在Hadoop上的数据仓库工具(框架)，可以将结构化的数据文件映射成一张数据表，并可以使用类sql的方式来对这样的数据

overfit同步小助手 2023-07-06 01:04:29 0 收藏

Hive 根据日期计算周数以及周几

余数就是周几（0~6），0 代表周日。示例：求日期。

overfit同步小助手 2023-07-05 22:05:00 0 收藏

Hive面试题十道

overfit同步小助手 2023-07-05 14:04:45 0 收藏

嘉明的云计算与大数据学习之大数据综合实验案例

本案例共包含4个实验步骤。(1)本地数据集上传到数据仓库Hive。(2)Hive数据分析。(3)Hive,MySQL、HBase数据互导。(4)利用R进行数据可视化分析。实验整体的流程如下：将数据源抽取到HDFS存储；通过Hive清洗、处理和计算原始数据；HIve清洗处理后的结果，可以存入Hbase

overfit同步小助手 2023-07-05 10:04:11 0 收藏

Hive和Impala的行列转换

hive行列转换

overfit同步小助手 2023-07-04 21:03:49 0 收藏

hive删除表数据方法

外部表insert overwrite table test_table select * fromtest_table where 1=0;insert overwrite table是覆盖数据，后面select是指使用哪里的数据进行覆盖，如果条件为空 where 1=0，那就代表清除数据。内部表

overfit同步小助手 2023-07-04 03:04:26 0 收藏

ROW_NUMBER()、RANK()、DENSE_RANK区别

ROW_NUMBER()、RANK()、DENSE_RANK区别ROW_NUMBER()：排序，不会有重复的排序数值。对于相等的两个数字，排序序号不一致DENSE_RANK()：排序，可有重复值。对于相等的两个数字，排序序号一致RANK()：排序，可有重复值。对于相等的两个数字，排序序号一致，但是总

overfit同步小助手 2023-07-03 16:04:35 0 收藏

初始化Hive元数据库 bash: schematool: 未找到命令的原因

初始化元数据库：schematool -initSchema -dbType mysql -verbose报错-bash: schematool: 未找到命令

overfit同步小助手 2023-07-03 04:04:24 0 收藏

利用Docker快速部署hadoop、hive和spark

文章目录一、配置文件yml1.docker-compose.yml二、执行脚本1.启动脚本run.sh2.关闭脚本stop.sh一、配置文件yml1.docker-compose.ymlversion: '3.4' services: namenode: image: test/hadoop

overfit同步小助手 2023-07-02 21:03:59 0 收藏

在Hive中判断字符串中是否包含指定子字符串

方法一用法:返回值函数名函数说明intlocate(string substr, string str[, int pos])Returns the position of the first occurrence of substr in str after position pos.使用案例:s

overfit同步小助手 2023-07-02 19:04:17 0 收藏

大数据框架之Hive：第7章综合案例练习（初级）

overfit同步小助手 2023-07-02 12:05:50 0 收藏

Hbase，Hive和Hdfs的关系以及区别

Hive是基于Hadoop的一个数据仓库工具，可以将结构化的数据文件映射为一张数据库表，并提供简单的sql查询功能，可以将sql语句转换为MapReduce任务进行运行。hive可以用来进行统计查询，HBase可以用来进行实时查询，数据也可以从Hive写到Hbase，设置再从Hbase写回Hive。

overfit同步小助手 2023-07-02 01:04:32 0 收藏

hive分区表之insert overwrite 注意事项

比如跑上月的数据最开始有44条记录，后面业务说不对，应该一条都没有的，结果你重跑了，确实跑出了0条记录，但是你插入的时候就是不能覆盖。所以这里有个注意事项！如果我们建立了一个分区表，如果每个月都要更新数据，不要因为省事就是用动态分区插入。但是今天遇到一个问题，如果我查询的数据=0，那么数据还会覆盖么

overfit同步小助手 2023-07-01 20:04:13 0 收藏