Hadoop - overfit.cn

Hive表锁机制原理以及各种场景的解决方案

hive 锁机制(S锁,X锁) 是由hive的事务管理器出发，锁的原理是一张表简称A表，我们对A表做查询操作的时候，就会获取到A表的S锁(共享锁), 如果对A表做alter 等其他操作就会获取A表的X锁(排他锁) 如果A表同时拥有S锁和X锁，A表就会死锁。死锁后的现象就是做drop truncat

overfit同步小助手 2023-12-01 20:03:51 0 收藏

Hive数据加载方式（load、insert；普通表、分区表）

overfit同步小助手 2023-12-01 13:03:41 0 收藏

Hadoop HDFS分布式文件系统（介绍以及基础操作命令）

HDFS是Hadoop三大组件（HDFS、MApReduce、YARN）之一。全称是Hadoop Distributed File System（Hadoop分布式文件系统）。是Hadoop技术栈内提供的分布式数据存储解决方案，可以在多台服务器上构建集群，存储海量的数据。2.HDFS基础架构HDFS

overfit同步小助手 2023-12-01 06:03:17 0 收藏

【Hadoop】四、Hadoop生态综合案例 ——陌陌聊天数据分析

背景介绍陌陌作为聊天平台每天都会有大量的用户在线，会出现大量的聊天数据，通过对聊天数据的统计分析，可以更好的对用户构建精准的用户画像，为用户提供更好的服务以及实现高ROI的平台运营推广，给公司的发展决策提供精确的数据支撑。FineBI的介绍：https://www.finebi.com/Fine

overfit同步小助手 2023-12-01 02:03:21 0 收藏

Linux安装zookeeper的详细过程

Linux安装zookeeper的详细过程；2181端口被占用的问题；启动hadoop集群；启动zookeeper；查看集群状态；关闭zookeeper；关闭Hadoop集群

overfit同步小助手 2023-11-30 23:03:31 0 收藏

一、配置安装hadoop环境

~ 代表的是用户的主文件夹，即 “/home/用户名” 这个目录，如你的用户名为 hadoop，则 ~ 就代表 “/home/hadoop/”进入/opt/hadoop-3.2.2/share/hadoop/mapreduce文件夹运行词频统计命令。则修改/opt/hadoop-3.2.2/etc/

overfit同步小助手 2023-11-30 20:03:38 0 收藏

[hive] 窗口函数 ROW_NUMBER()

在 Hive SQL 中，是一个用于生成行号的窗口函数。它可以为。以下是子句可选，用于指定，它将结果集划分为不同的分区。每个分区内的行都会有独立的行号计数，即行号从1开始重新计数。ORDER BY子句用于指定，它决定了如何对分区内的行进行排序。行号将根据指定的排序顺序进行分配。函数可以与其他窗口函数

overfit同步小助手 2023-11-30 19:03:50 0 收藏

深入理解Kafka3.6.0的核心概念，搭建与使用

Kafka是最初由Linkedin公司开发，是一个分布式、支持分区的（partition）、多副本的（replica），基于zookeeper协调的分布式消息系统，它的最大的特性就是可以实时的处理大量数据以满足各种需求场景：比如基于hadoop的批处理系统、低延迟的实时系统、Storm/Spark流

overfit同步小助手 2023-11-30 18:03:41 0 收藏

Hive创建分区表并插入数据

静态分区在插入数据时要指定分区名，支持load、insert两种插入方式，主要用于分区少，分区名可以确定的情况。

overfit同步小助手 2023-11-30 16:03:41 0 收藏

Linux虚拟机系统Ubuntu搭建Hadoop集群

大学生大数据实验亲手实操笔录，希望可以帮助到大家。

overfit同步小助手 2023-11-30 15:03:46 0 收藏

解决一些hive中的一些错误和解决方式

2. 初始化元数据库(derby) bin/schematool -dbType derby -initSchema。hadoop和hive的两个guava.jar版本不一致。删除低版本的那个，将高版本的复制到低版本目录下。1. hive 启动。

overfit同步小助手 2023-11-30 11:03:27 0 收藏

HDFS编程实践(Hadoop3.1.3)

Hadoop 分布式文件系统是Hadoop核心组件之一。介绍Linux操作系统中关于HDFS文件操作的常用Shell命令，利用Web界面查看和管理Hadoop文件系统，以及利用Hadoop提供的Java API进行基本的文件操作。解决File hdfs://localhost:9000/user/h

overfit同步小助手 2023-11-30 10:03:48 0 收藏

[shell,hive] 在shell脚本中将hiveSQL分离出去

将Hive SQL语句写在单独的.hql文件中，然后在shell脚本中调用这些文件来执行Hive查询。这样可以将SQL语句与shell脚本分离，使代码更加清晰和易于维护。

overfit同步小助手 2023-11-29 23:03:22 0 收藏

大数据基础设施搭建 - Hadoop

代理配置：hadoop.proxyuser.hadoop.hosts必须配，hadoop.proxyuser.hadoop.groups和hadoop.proxyuser.hadoop.users至少配置一个。hadoop.proxyuser.hadoop.hosts和hadoop.proxyuse

overfit同步小助手 2023-11-29 21:03:52 0 收藏

【简单易懂版】使用IDEA操作Hadoop（增删改查）

在IDEA中使用JAVA代码操作Hadoop完成增删改查，上传、下载基础功能

overfit同步小助手 2023-11-29 20:03:40 0 收藏

大数据毕业设计选题推荐-无线网络大数据平台-Hadoop-Spark-Hive

随着无线通信技术的快速发展和广泛应用，无线网络已经成为了现代社会信息交流的重要基础设施。为了满足日益增长的网络需求，提高无线网络的覆盖范围和服务质量变得尤为重要。然而，这需要解决许多技术挑战，其中之一就是如何规划、设计、维护和优化无线网络。在当前的无线网络大数据平台中，存在一些问题和挑战。首先，网络

overfit同步小助手 2023-11-29 17:03:45 0 收藏

【Hadoop实战】Hadoop指标系统V2分析

hadoop的指标系统V2

overfit同步小助手 2023-11-28 13:03:52 0 收藏

Hive 动态分区以及分区以及中文分区字段

hive 提供了一个动态分区功能，其可以基于查询参数的位置去推断分区的名称，从而建立分区。

overfit同步小助手 2023-11-28 13:03:42 0 收藏

Centos 虚拟机安装

安装vmware，centos7

overfit同步小助手 2023-11-28 10:03:34 0 收藏

记录一次hadoop集群上secondarynamenode无法启动的bug的解决办法

这个错误其实是由于重复格式化导致namenode和datanode的namespaceID和clusterID不一致引起的解决方法如下:解决方案：1.关闭所有服务并重启（保证Hadoop的服务被杀死）2.清理：将hadoop的根目录中的data，logs全部删除(三台节点)将 /tmp下的内容全部删

overfit同步小助手 2023-11-28 00:03:50 0 收藏