大数据 Hadoop - overfit.cn

[Hadoop三大组件之一]MapReduce——WordCount案例

✅作者简介：大家好,我是Philosophy7？让我们一起共同进步吧！🏆📃个人主页：Philosophy7的csdn博客🔥系列专栏：Hadoop💖如果觉得博主的文章还不错的话，请点赞👍+收藏⭐️+留言📝支持一下博>主哦🤞MapReduce一、简单认识MapReduce二、官方案例

overfit同步小助手 2022-04-29 09:03:46 0 收藏

Hadoop快速入门——入门考试(伪分布式60+编码25+执行jar15)

Hadoop快速入门——入门考试(伪分布式60+编码25+执行jar15)1、创建1台Linux虚拟机，并打开对应的网络连接(VMnet8)(5分)2、通过xshell正确连接Linux虚拟机(5分)3、在【/opt/】文件夹下上传【java】以及【hadoop】压缩包(5分)4、解压【java】以

overfit同步小助手 2022-04-29 09:03:36 0 收藏

Hadoop快速入门——第四章、zookeeper(集群)

Hadoop快速入门——第四章、zookeeper集群前置条件：配置ssh免密登录&hadoop分布式1、上传【zookeeper-3.4.6.tar.gz】文件2、解压文件tar -zxvf zookeeper-3.4.6.tar.gz3、修改文件名称方便操作mv zookeeper-3.

overfit同步小助手 2022-04-28 08:21:34 0 收藏

HIVE学习系列——windows Hadoop安装（上）

文章目录Hadoop安装HIVE MySQL版本安装Hadoop安装Hadoop官网点击Download选择Binary download下的最新版本即可Source Distribution 表示源代码版，需要编译后使用Binary Distribution 表示可执行版，直接解压使用点击该条链接

overfit同步小助手 2022-04-28 08:21:24 0 收藏

hadoop伪分布式安装（超详细）

hadoop伪分布式安装

overfit同步小助手 2022-04-27 08:21:40 0 收藏

MapReduce使用

maven:<dependency> <groupId>org.apache.hadoop</groupId> <artifactId>hadoop-client</artifactId> <versio

overfit同步小助手 2022-04-27 08:21:26 0 收藏

Hadoop完全分布式环境部署(一看就会）

Hadoop完全分布式环境部署

overfit同步小助手 2022-04-27 08:21:22 0 收藏

Hadoop集群启动和关闭脚本

文章目录Hadoop集群启动关闭脚本一、Hadoop集群启动脚本1.在cd $HADOOP_HOME路径下创建jiqunstart.sh文件。二、Hadoop集群关闭脚本1.同理在cd $HADOOP_HOME路径下创建jiqunstop.sh文件。三、运行两个脚本1.脚本运行成功后，打开50070

overfit同步小助手 2022-04-25 07:21:46 0 收藏

大数据笔记（三）：HDFS集群搭建-伪分布式模式

HDFS集群搭建-伪分布式模式

overfit同步小助手 2022-04-25 07:21:31 0 收藏

hadoop集群之hdfs文件系统常见操作命令

hdfs文件系统常见操作命令

overfit同步小助手 2022-04-23 11:41:40 0 收藏

使用最新版flink tidb cdc 同步数据到StarRocks

Flink CDC 2.2 版本新增了 OceanBase CE，PolarDB-X，SqlServer，TiDB 四种数据源接入。其中新增 OceanBase CDC，SqlServer CDC，TiDB CDC 三个连接器，而 PolarDB-X 的支持则是通过对 MySQL CDC 连接器进行

overfit同步小助手 2022-04-22 08:08:17 0 收藏

初步认识Hadoop

学习目的· 了解大数据的概念及其特征· 了解Hadoop发展· 掌握Hadoop的生态体系Hadoop作为一个能够对大量数据进行分布式处理的软件框架，用户可以利用Hadoop生态体系开发和处理海量数据。由于Hadoop可靠及高效的处理性能，逐渐称为分析大数据的领先平台。1.1 什么是大数据从

overfit同步小助手 2022-04-21 07:08:13 0 收藏

Hadoop完全分布式配置

1.虚拟机环境准备1.1 克隆虚拟机1.2. 修改克隆虚拟机的静态IP机器名静态IPmaster192.168.121.151slaver1192.168.121.152slaver2192.168.121.153[root@master Desktop]# vi /etc/sysconfig/ne

overfit同步小助手 2022-04-20 10:08:34 0 收藏

大数据入门-什么是Kudu

Kudu是Cloudera开源的新型列式存储系统，是Apache Hadoop生态圈的成员之一，专门为了对快速变化的数据进行快速的分析，填补了以往Hadoop存储层的空缺。

overfit同步小助手 2022-04-18 09:40:33 0 收藏

Hadoop快速入门——第二章、分布式集群（第一节、网络与ssh登录配置）

第二章、hadoop分布式集群1、配置静态IP地址和修改主机名2、配置主机名查询静态表3、配置SSH免密

overfit同步小助手 2022-04-17 09:01:35 0 收藏

Hadoop快速入门——第二章、分布式集群（第二节、Hadoop分布式模式搭建）

第二章、hadoop分布式集群Hadoop分布式模式搭建流程：1、修改配置文件core-site.xml hdfs-site.xml mapred-site.xml yarn-site.xml slaves1、配置【core-site.xml】vi /opt/hadoop/etc/hadoop/co

overfit同步小助手 2022-04-17 09:01:32 0 收藏

Oozie常用命令

启动命令:bin/oozied.sh start关闭命令:bin/oozied.sh stop页面访问:http://node01:11000/oozie/查看信息:bin/oozie job -oozie http://node01:11000/oozie -info 0000029-191027

overfit同步小助手 2022-04-16 07:38:42 0 收藏

HDFS小文件问题分析与解决方案（面试层面~）

1）会有什么影响（1）存储层面：1个文件块，占用namenode多大内存150字节1亿个小文件150字节1个文件块 * 150字节（2）计算层面：每个小文件都会起到一个MapTask，占用了大量计算资源2）怎么解决（1）采用har归档方式，将小文件归档（2）采用CombineTextInputFor

overfit同步小助手 2022-04-15 07:38:05 0 收藏

保姆级Hadoop集群部署

保姆级hadoop集群部署

overfit同步小助手 2022-04-14 07:38:35 0 收藏

Spark开发环境的搭建

(1)在/opt目录下建立 software,module两个文件，software用来下载安装包，下载或的安装包可以解压到module文件。小编下载spark的版本是：spark-2.3.2-bin-hadoop2.7.tgz。所以下载spark版本到software文件后，解压到module文件

overfit同步小助手 2022-04-11 07:43:30 0 收藏