大数据 Hive - overfit.cn

Hive Code2报错排查

大多数可能的code2报错一般是内存不够，所以加下面这个配置可以有效解决这个问题#取消小表加载至内存中但这个不一定是因为内存不够，其实很多错误都是报这种官方错误的，所以一定要去yarn上看日志。很多人看日志也找不到问题，因为并没有看到全部日志，翻到最底下，点击check here 才能看到完整日志。

overfit同步小助手 2023-08-01 23:04:25 0 收藏

关于Java连接Hive，Spark等服务的Kerberos工具类封装

overfit同步小助手 2023-08-01 14:05:12 0 收藏

hive on spark 时，executor和driver的内存设置，yarn的资源设置

hive on spark 时，executor和driver的内存设置，yarn的资源设置。

overfit同步小助手 2023-08-01 12:04:52 0 收藏

构建大数据环境：Hadoop、MySQL、Hive、Scala和Spark的安装与配置

安装Hadoop 首先，从Apache Hadoop的官方网站下载所需的Hadoop发行版。选择适合你系统的二进制发行版，下载完成后解压缩到安装目录。然后配置环境变量，并修改Hadoop的配置文件，根据需要进行修改。安装MySQL 安装MySQL服务器是搭建大数据环境的重要一步。更新包管理器后，执行

overfit同步小助手 2023-08-01 10:04:11 0 收藏

hive基于新浪微博的日志数据分析——项目及源码

本系统旨在对新浪微博日志进行大数据分析，探究用户行为、内容传播、移动设备等多个方面的特征和趋势，为企业和个人的营销策略、产品设计、用户服务等提供有益的参考和支持。系统基于Hive平台，能够对大规模的微博数据进行处理和分析，输出有关用户量、微博转发量、用户发布微博数量、带图片微博数据等多个方面的统计信

overfit同步小助手 2023-07-31 23:04:04 0 收藏

hive之with as 和 create temporary区别

在写hivesql语句时，通常因为实现一个比较复杂的逻辑时。

overfit同步小助手 2023-07-31 22:04:33 0 收藏

Hive中的HASH函数规则及示例

Hive中的哈希函数采用的是MurmurHash算法，这是一种非常高效的哈希算法。该算法将输入数据分为若干个块，每个块都进行哈希计算，最终将所有块的哈希值合并起来得到最终的哈希值。在执行上述查询语句时，Hive会自动调用HASH函数对每个姓名进行哈希计算，并将具有相同哈希值的姓名放入同一个分组中，最

overfit同步小助手 2023-07-31 11:04:08 0 收藏

大数据技术之Spark——Spark SQL

我们之前学习过hive，hive是一个基于hadoop的SQL引擎工具，目的是为了简化mapreduce的开发。由于mapreduce开发效率不高，且学习较为困难，为了提高mapreduce的开发效率，出现了hive，用SQL的方式来简化mapreduce：hive提供了一个框架，将SQL转换成ma

overfit同步小助手 2023-07-31 04:03:56 0 收藏

hive创建唯一标识列(自增id)

overfit同步小助手 2023-07-30 14:04:26 0 收藏

Oracle 迁移 Hive 过程中遇到的问题总结

最近一个小伙伴在做从Oracle到Hive的业务迁移工作，在迁移过程中属实遇到了一些坑，今天就来汇总一下这些坑，避免以后大家其他业务迁移的时候再出现类似的问题，即使出现了也可以拿过来进行对照解决。在迁移业务的过程中，要了解不同系统中函数的用法，希望我遇到的坑，给大家带来一点借鉴意义！

overfit同步小助手 2023-07-30 13:03:54 0 收藏

Hive调优之计算资源配置(一）

hive调优

overfit同步小助手 2023-07-30 00:04:02 0 收藏

flink-sql读写hive-1.16

本文为 flink 1.16 官网中读写 hive 部分的翻译整理。

overfit同步小助手 2023-07-29 15:04:25 0 收藏

Hive窗口函数-lead/lag函数

overfit同步小助手 2023-07-29 13:04:35 0 收藏

SQL实现一行数据分组后转多行多列

通过聚合拆分再聚合的方式实现一行数据变分组的多行多列

overfit同步小助手 2023-07-29 10:04:10 0 收藏

hive中substring_index()的使用

hive sql substring_index

overfit同步小助手 2023-07-29 10:04:00 0 收藏

解决Hive视图View数据乱码的问题

overfit同步小助手 2023-07-29 07:04:00 0 收藏

Hive（25）：Select高级查询之Subqueries子查询

1 from子句中子查询在Hive0.12版本，仅在FROM子句中支持子查询。而且必须要给子查询一个名称，因为FROM子句中的每个表都必须有一个名称。子查询返回结果中的列必须具有唯一的名称。子查询返回结果中的列在外部查询中可用，就像真实表的列一样。子查询也可以是带有UNION的查询表达式。Hive支

overfit同步小助手 2023-07-29 05:04:13 0 收藏

sql数据类型映射与数据类型转换

MaxCompute 2.0新增了DECIMAL类型与DATETIME的常量定义方式，100BD是数值为100的DECIMAL，2017-11-11 00:00:00是DATETIME类型的常量。关于CAST的介绍请参见CAST。关系运算符包括=、<>、<、<=、>、>=、IS NULL、IS NO

overfit同步小助手 2023-07-27 23:04:19 0 收藏

Flink Direct Reader访问Hive ACID表被ranger授权限制

Flink Direct Reader 绕过了 Hive Thrift 接口，直接读取 Hive ACID 表的数据文件，因此无法受到 Ranger 的授权限制。要在受到 Ranger 鉴权的环境中访问 Hive ACID 表，可以考虑使用 Hive Thrift 接口或配置适当的 Ranger 授

overfit同步小助手 2023-07-27 15:04:10 0 收藏

Hive 窗口函数大全

hive的窗口函数使用集合和使用示例

overfit同步小助手 2023-07-27 14:04:14 0 收藏