（超详细）Spark on Yarn安装配置

使用 root 用户完成相关配置，已安装配置Hadoop 及前置环境

/etc/profile末尾添加下面代码

export SPARK_HOME=.../spark-3.1.1-bin-hadoop3.2(注意：需要替换成你自己得路径)
export PATH=$PATH:$SPARK_HOME/bin:$SPARK_HOME/sbin

source /etc/profile

显示如下

在.../spark-3.1.1-bin-hadoop3.2/conf目录下，将下面两行添加至spark-env.sh文件末尾：

HADOOP_CONF_DIR=.../hadoop-3.1.3/etc/hadoop
YARN_CONF_DIR=.../hadoop-3.1.3/etc/hadoop

命令如下：

spark-submit --master yarn --class org.apache.spark.examples.SparkPi $SPARK_HOME/examples/jars/spark-example_2.11-2.1.1.jar

结果显示如下:

如果报内存大小错误，修改yarn-site.xml,设置虚拟内存，至少是物理内存的4倍

标签： spark 大数据分布式

本文转载自: https://blog.csdn.net/m0_67447926/article/details/135437696
版权归原作者 数据爬坡ing 所有，如有侵权，请联系我们删除。