idea配置spark环境

下载maven的版本包，建议去官网下载Maven – Maven Releases History (apache.org)

建议下载版本是3.8.8

然后进入settings里的maven界面

将maven home path 设置为你下载的路径：

此时下面的version会改变

随后打开路径中的maven包，选择conf文件夹，选择settings.xml，用vscode打开

找到<mirror>镜像设置，注释掉原来的，添加阿里云的镜像（去浏览器搜索aliyun maven即可复制）

配置完成后在文件夹外多创建一个repository文件夹

回到idea，点击右侧的override重写

然后打开文件目录，第一个选择你刚刚配置的settings，第二个选择你创造的repository文件夹，

点击apply(一定要点击！！！)

然后你的maven就配置好了，最好是在最开始的idea界面配置，别打开任何的工作空间。

就是在这个界面，选择customize的all settings：

然后创建新的project，选择maven，建立新的工作空间即可。

2.配置hadoop环境变量

由于windows与hadoop不兼容，建议去下载winutils。

项目概览 - winutils - GitCode

下载zip,选出hadoop-3.0.0版本（建议）

点击我的电脑-属性-高级系统设置-环境变量，在系统变量里新建一个系统变量，如下图：

然后进入Path（系统变量里的），新建一个：

hadoop环境变量配置完成

3.spark jars包的配置

去官网下载spark的3.5.0版本（建议）

Index of /dist/spark (apache.org)

选择3.5.0-hadoop3-scala.2.13的tgz

下载完成后解压，随后进入idea的新project里面，打开file-project structure:

点击library中的加号：

先选择scala sdk,2.13.12版本：

然后添加spark的jars包（记得选中jars文件夹）：

然后再modules的dependencies勾选刚刚添加的两个libraries:

点击apply（一定！！！），随后点ok退出

这样就完成所有步骤了，编写spark独立应用程序吧。

标签： java scala spark

本文转载自: https://blog.csdn.net/m0_70532285/article/details/135413864
版权归原作者 Ra1n70 所有，如有侵权，请联系我们删除。