大数据 Hadoop - overfit.cn

Hbase环境搭建

本文详细的写有：Hadoop伪分布式Hbase环境搭建、Hadoop完全分布式Hbase环境搭建的步骤。

overfit同步小助手 2023-05-18 00:03:46 0 收藏

Hive之grouping sets用法详解

比如(class, course), 二进制为 101，十进制则为5，则grouping__id为5，同理grouping__id为6，则组合为（sex,course），二进制为110；比如 group by class,sex,course,则二进制的顺序为：course sex cl

overfit同步小助手 2023-05-17 20:03:57 0 收藏

【Hadoop Linux安装jdk1.8】

本文是按照林子雨老师的课程进行安装，Hadoop3.1.3需要JDK版本在1.8及以上。需要按照下面步骤来自己手动安装JDK1.8。

overfit同步小助手 2023-05-17 01:04:00 0 收藏

基于前置搭建的 Hbase 环境上配置 Spark 开发环境

Spark 集群部署采用 yarn 模式进行资源调度管理，这样部署更加简单，因 Hadoop 在之前已经进行集群安装，Spark 是提交 jar 到 yarn 中进行运行，只需要在任意一台中安装 Spark 客户端即可，而又因为是集群模式可能导致作业在未安装 Spark 的节点上运行，推荐的做法是上

overfit同步小助手 2023-05-17 00:03:49 0 收藏

【hadoop——Hive的安装和配置】保姆式教学

目录一.Hive的安装和配置1.Hive并不是hadoop自带的组件，因此我们需要去下载hive，此次课我们使用hive 1.2.1版本，下载地址为：2.下载完成之后，安装包默认保存在下载文件夹中，解压安装包apache-hive-1.2.1-bin.tar.gz至路径 /usr/local，命令如

overfit同步小助手 2023-05-17 00:03:38 0 收藏

Hadoop集群启动后命令JPS没有DataNode或者NameNode

a:进入/opt/module/hadoop-3.1.3/data/dfs目录里面删除掉所有文件。c:进入/opt/module/hadoop-3.1.3/logs目录里面删除掉所有文件。1）需要检查core-site.xml 和 hdfs-site.xml这俩文件，配置没错的话再看第二条。2）可能

overfit同步小助手 2023-05-16 19:04:07 0 收藏

实验5：MapReduce 初级编程实践

由于CSDN上传md文件总是会使图片失效完整的实验文档地址如下：https://download.csdn.net/download/qq_36428822/85709497实验内容与完成情况：（一）编程实现文件合并和去重操作对于两个输入文件，即文件 A 和文件 B，请编写 MapReduce 程序

overfit同步小助手 2023-05-16 15:04:01 0 收藏

Hadoop HDFS

首先是一个文件系统，就是用来存储文件、存储数据。是大数据最底层一个服务。其次是一个分布式的文件系统。分布式意味着多台机器存储。场景互动：如何模拟实现分布式文件系统。或者说一个成熟的分布式文件系统应该要具备哪些属性、功能呢？分布式多台机器存储记录元数据分块存储副本机制（备份）

overfit同步小助手 2023-05-16 13:03:41 0 收藏

ubuntu系统hadoop伪分布搭建详细教程

在ubuntu系统中，进行ssh jdk hadoop安装和配置，搭建hadoop伪分布集群

overfit同步小助手 2023-05-16 10:03:40 0 收藏

2022.04.27智警杯CIPUC校内选拔赛-伪集群安装

Hadoop伪集群安装1、基础配置考核条件如下：(1) 按照左侧虚拟机名称修改对应主机名为hadoop000(使用hostnamectl命令)hostnamectl set-hostname hadoop000bash命令详解：hostnamectl命令用来管理给定主机中使用的三种类型的主机名ba

overfit同步小助手 2023-05-16 04:03:42 0 收藏

实验4 NoSQL和关系数据库的操作比较

实验4NoSQL和关系数据库的操作比较1.实验目的（1）理解四种数据库(MySQL、HBase、Redis和MongoDB)的概念以及不同点；（2）熟练使用四种数据库操作常用的Shell命令；（3）熟悉四种数据库操作常用的Java API。2.实验平台（1）操作系统：Linux（建议Ubuntu16

overfit同步小助手 2023-05-16 01:03:43 0 收藏

【头歌】大数据从入门到实战 - 第2章分布式文件系统HDFS

在右侧命令行中启动Hadoop，进行如下操作。在HDFS中创建/usr/output/文件夹；在本地创建hello.txt文件并添加内容：“HDFS的块比磁盘的块大，其目的是为了最小化寻址开销。”；将hello.txt上传至HDFS的/usr/output/目录下；删除HDFS的/user/hado

overfit同步小助手 2023-05-15 22:03:55 0 收藏

Hive元数据信息获取

放到mysql中存储，mysql中默认表被创建的时候用的是默认的字符集(latin1)，所以会出现中文乱码。（2）修改hive-site.xml中Hive读取元数据的编码（注意原先是否配置过）注意的是，之前创建的表的元数据已经损坏了，所以无法恢复中文乱码，只能重新创建表。

overfit同步小助手 2023-05-15 17:03:49 0 收藏

Azkaban的安装部署

介绍：Azkaban 是个简单的批处理调度器，用来构建和运行Hadoop作业或其他脱机过程。整体包括三部分webserver、dbserver、executorserver。 Azkaban是由Linkedin开源的一个Java项目，批量工作流任务调度器。用于在一个工作流内以一个特定的顺序运行一组

overfit同步小助手 2023-05-15 08:03:59 0 收藏

HBase常用Shell命令

在使用具体的Shell命令操作HBase数据之前，需要首先启动Hadoop，然后再启动HBase，并且启动HBase Shell，进入Shell命令提示符状态，具体命令如下：cd /usr/local/hadoop./sbin/start-dfs.shcd /usr/local/hbase./bin

overfit同步小助手 2023-05-14 23:03:40 0 收藏

Hive本地开发/学习环境配置

这样就启动了metastore服务，可以通过jps命令查看，是否存在RunJar的进程，存在则说明启动成功，再通过hive客户端连接即可。该服务依赖于metastore服务，所以，在启动hiveserver2之前，一定确保已经启动了metastore服务，这时，可以通过。，启动后，通过jps命令查看

overfit同步小助手 2023-05-14 21:03:43 0 收藏

基于hadoop和echarts的教育大数据可视化系统毕设完整的代码+数据集

overfit同步小助手 2023-05-14 16:03:37 0 收藏

大数据之MapReduce框架简介

MapReduce分布式计算框架

overfit同步小助手 2023-05-14 13:03:45 0 收藏

合肥工业大学2022大数据技术实验二

二在Hadoop平台上部署WordCount程序实验时间∶2022年5月14日在Hadoop平台上部署WordCount程序。该项任务请同学作为作业自行完成，并提交实验报告。

overfit同步小助手 2023-05-14 09:03:46 0 收藏

大数据 | （五）通过Sqoop实现从MySQL导入数据到HDFS

一文带你了解MySQL通过Sqoop导入数据到Hdfs的详细过程。

overfit同步小助手 2023-05-14 08:04:15 0 收藏