Hadoop - overfit.cn

2023.11.8 hadoop 概述和发展, shell命令和服务启动命令

hdfs默认文件: https://hadoop.apache.org/docs/r3.3.4/hadoop-project-dist/hadoop-hdfs/hdfs-default.xml。hdfs的shell命令概念: 安装好hadoop环境之后，可以执行类似于Linux的shell命令对文件

overfit同步小助手 2023-11-27 22:03:33 0 收藏

Hadoop 之 Hbase 配置与使用（四）

Hbase 单机部署、伪集群、集群部署Java 连接 Hbase 集群测试

overfit同步小助手 2023-11-27 16:03:23 0 收藏

HBase高手之路4-Shell操作

describe '表名'注意：集群启动启动ZooKeeper启动hdfs启动HBASE进入shell命令行在HBase中，如果要对海量的数据进行扫描查询，尤其是全表扫描效率很低，可以使用过滤器Filter来提高查询的效率。过滤器Filter可以根据主键、列簇、列、版本号(时间戳)等条件对数据进行查

overfit同步小助手 2023-11-27 14:04:05 0 收藏

Hive复杂数据类型(array类型、map类型、struct类型)

一、array类型建表语句：create table 表名(要素1 类型，要素2 类型，要素3 array) row format delimited fileds terminated by '\t' collection items terminated by ',';

overfit同步小助手 2023-11-27 09:03:31 0 收藏

[hive]维度模型分类:星型模型,雪花模型,星座模型|范式

z=f(x,y)当给定x,y则能计算出z,当给x,y,n时，也能计算出z，此时z部分函数依赖于z,y,n。比如通过（学号，课程）推出姓名，因为可以直接通过学号退出姓名，所以：姓名部分依赖于（学号，课程）。星型模型中只有一张事实表，以及0张或多张维度表，事实与纬度表通过主键外键相关联，维度之间不存在关

overfit同步小助手 2023-11-27 01:03:57 0 收藏

hive sql 行列转换开窗函数炸裂函数

讲师表 teacher.csv课程表 course.csv分数表 score.csv员工表 emp.csv雇员表 employee.csv电影表 movie.txt订单表 order.csv创建数据库和数据表行列转换列转行行专列

overfit同步小助手 2023-11-26 21:03:53 0 收藏

HBase（单机）伪分布式安装

Hbase单机伪分布式安装

overfit同步小助手 2023-11-26 21:03:25 0 收藏

大数据第一步-Mac安装Hadoop3

前提是把jJDK8安装好，hadoop3.x最低需要jdk8。然后打开共享把远程登陆打开，不打开说是后面会报错，到终端输入命令：ssh localhost生成新的keygen否则后面会报错 Permission denied 命令：ssh-keygen -t rsa -P '' -f ~/.ssh/

overfit同步小助手 2023-11-26 18:03:49 0 收藏

Hadoop3.0大数据处理学习1（Haddop介绍、部署、Hive部署）

Hadoop是一个适合海量数据存储与计算的平台。是基于Google的GoogleFS、Map Reduce、BigTable实现的。移动数据：数据 -> 计算程序移动计算：计算程序 -> 数据分布式计算：各个节点局部计算 -> 第二阶段汇总程序官方版本：Apache Hadoop，开源，集群安装维护

overfit同步小助手 2023-11-26 14:03:47 0 收藏

基于Hadoop的高校图书馆阅读书目智慧推荐系统设计

通过Hadoop技术的应用，为学生们构建一个智能化、个性化、高效的阅读书目推荐系统，可以帮助学生们准确快速地获取所需的图书信息，节省时间和精力，提高学习效益。本文针对高校图书馆读者阅读需求多样化、阅读书目庞大的问题，以及传统推荐系统存在的问题和局限性，提出了基于Hadoop的高校图书馆阅读书目智慧推

overfit同步小助手 2023-11-26 14:03:41 0 收藏

[Hive] 查询结果保存

此外，还可以使用INSERT INTO语句来将查询结果追加到表或分区中，而不是覆盖现有的数据。上述示例将从表table_name中选择满足条件的数据，并将结果以文件的形式覆盖输出到指定的目录/path/to/directory。需要注意的是，使用INSERT OVERWRITE DIRECTORY语

overfit同步小助手 2023-11-26 13:03:14 0 收藏

创建Hadoop单机模式（新手专用超详细！）

第一步、将压缩包上传至/home/hadoop，然后解压缩jdk文件jdk-8u301-linux-x64.tar.gz（此压缩包直接到CSDN搜索栏搜索名称即可下载）第一步，将压缩包上传至/home/hadoop，然后解压缩包hadoop-3.3.1.tar.gz（压缩包获取方法同上JDK）第二步

overfit同步小助手 2023-11-26 10:03:47 0 收藏

Hadoop—20.网站日志分析项目案例（详解）

本次实践的目的就在于通过mapreduce方法对apache common日志进行分析，计算一些关键指标。

overfit同步小助手 2023-11-26 05:03:27 0 收藏

从零开始的Hadoop学习（四）| SSH无密登录配置、集群配置

1）各个模块分开启动/停止（配置 ssh 是前提）常用整体启动/停止 HDFS整体启动/停止 YARN2）各个服务组件逐一启动/停止分别启动/停止 HDFS 组件启动/停止 YARN。

overfit同步小助手 2023-11-25 21:03:53 0 收藏

大数据毕业设计选题推荐-机房信息大数据平台-Hadoop-Spark-Hive

随着信息技术的飞速发展，机房在现代企业和组织中扮演着越来越重要的角色。机房不仅负责存储和管理大量关键数据，还为各种业务系统提供稳定运行的基础设施。然而，机房的运行和维护面临着诸多挑战，如设备故障、信号波动等。为了确保机房的正常运行，对机房信息的实时监控和分析显得尤为重要。因此，研究机房信息大数据平台

overfit同步小助手 2023-11-25 12:03:41 0 收藏

一百八十八、Hive——HiveSQL查询表中的日期是星期几（亲测，附截图）

HiveSQL查询表中的日期是星期几（亲测，附截图）

overfit同步小助手 2023-11-25 11:03:40 0 收藏

Hadoop原理，HDFS架构，MapReduce原理

overfit同步小助手 2023-11-25 10:03:52 0 收藏

hadoop搭建、mysql、hive部署

大数据基础项目，基于hadoop、mysql、hive实现数据分析

overfit同步小助手 2023-11-25 08:03:52 0 收藏

搭建hadoop初次格式化格式化了很多次报错解决方案（亲测好用）

那我们在格式化时，不小心格式化多次，就会导致主从节点之间互相不识别。然后导致启动hadoop集群时，主节点的namenode进程可能不会启动或者从节点的datanode可能不会启动。在搭建完hadoop集群时，初次启动HDFS集群，需要对主节点进行格式化操作，其本质是清理和做一些准备工作，因为此时的

overfit同步小助手 2023-11-24 20:03:40 0 收藏

Windows安装Hadoop3.x及在Windows环境下本地开发

在Windows环境下安装与配置Hadoop3.x版本，以及在Windows环境下结合Hadoop环境进行本地开发。

overfit同步小助手 2023-11-24 07:03:16 0 收藏