0


Hadoop集群搭建与初步了解Hive

1.Hadoop集群搭建

(1)单机模式

(2)集群模式

2.Hadoop集群使用

(1)一键启动大数据环境 /onekey/my-start-all.sh

(2)一键关闭大数据环境 /onekey/my-stop-all.sh

(3)查看进程 jps

(4)查看hdfs页面 2.x版本:50070 3.x版本:9870

(5)查看yarn页面 8088

(6)查看日志 19888

3.Hadoop集群使用

评估圆周率

(1)cd /export/server/hadoop-2.7.5/share/hadoop/mapreduce

(2)hadoop jar hadoop-mapreduce-examples-2.7.5.jar pi x y

第一个参数pi:表示MapReduce程序执行圆周率计算;

第二个参数x:用于指定map阶段运行的任务次数,并发度

第三个参数!y:用于指定每个map任务取样的个数!

(3)查看yarn页面

3.hadoop的shell命令

Hadoop提供了文件系统的shell命令使用格式如下: hadoop fs <args>或者 hdfs dfs <args>

(1)ls命令

格式: hadoop fs -ls URI

作用:类似于Linux的ls命令,显示文件列表 hadoop fs -ls / #显示文件列表 hadoop fs –ls -R / #递归显示文件列表

(2) mkdir命令

格式 : hadoop fs –mkdir [-p] <paths>

作用 : 以中的URI作为参数,创建目录。使用-p参数可以递归创建目录

应用: hadoop fs -mkdir /dir1 hadoop fs -mkdir -p /aaa/bbb/ccc

(3) mv命令

格式 : hadoop fs -mv

作用: 将hdfs上的文件从原路径src移动到目标路径dst,该命令不能夸文件系统

应用: hadoop fs -mv /dir1/1.txt /dir2

(4) rm命令

格式: hadoop fs -rm [-r] [-skipTrash] URI [URI 。。。] 作用: 删除参数指定的文件和目录,参数可以有多个,删除目录需要加-r参数 如果指定-skipTrash选项,那么在回收站可用的情况下,该选项将跳过回收站而直接删除文件; 否则,在回收站可用时,在HDFS Shell 中执行此命令,会将文件暂时放到回收站中。

应用: hadoop fs -rm /initial-setup-ks.cfg #删除文件 hadoop fs -rm -r /dir2 #删除目录

(5) cp命令

格式: hadoop fs -cp

作用: 将文件拷贝到目标路径中

应用: hadoop fs -cp /dir1/1.txt /dir2

(6)cat命令

格式: hadoop fs -cat

作用: 将参数所指示的文件内容输出到控制台

应用: hadoop fs -cat /dir1/1.txt

(7) put命令

格式 : hadoop fs -put ...

作用 : 将单个的源文件或者多个源文件srcs从本地文件系统上传到目标文件系统中。

应用: hadoop fs -put /root/1.txt /dir1 #上传文件 hadoop fs –put /root/dir2 / #上传目录

4.Hive体验

(1)进入hive shell环境

expect beeline.exp

(2)创建表 CREATE TABLE test(id INT,name STRING,gender STRING);

(3)插入数据 INSERT INTO test VALUES(1,'wang','男');

(4)查询数据 SELET name,gender FROM test;

5.Hive链接客户端

标签: hadoop hive 大数据

本文转载自: https://blog.csdn.net/wy267945485/article/details/138136494
版权归原作者 覆雪之下225 所有, 如有侵权,请联系我们删除。

“Hadoop集群搭建与初步了解Hive”的评论:

还没有评论