大数据 Scala - overfit.cn

使用Intellij idea编写Spark应用程序(Scala+Maven)

对Scala代码进行打包编译时，可以采用Maven，也可以采用sbt，相对而言，业界更多使用sbt。这里介绍IntelliJ IDEA和Maven的组合使用方法。IntelliJ IDEA和SBT的组合使用方法，请参考“使用Intellij Idea编写Spark应用程序（Scala+SBT）”。

overfit同步小助手 2024-05-28 22:03:39 0 收藏

孙悟空被压500年也想不出看文档瞬间就会scala和spark以及hadoop

export HADOOP_CONF_DIR=/usr/local/src/hadoop/etc/hadoop #指定hadoop路径。解压tar -zxvf /opt/software/hadoop-2.7.1.tar.gz -C /usr/local/src。export HADOOP_HOME

overfit同步小助手 2024-05-25 20:04:33 0 收藏

Spark--Scala基础知识总结(第二章)

Scala会区分不同类型的值，并且会基于使用值的方式确定最终结果的数据类型，这称为类型推断Scala使用类型推断可以确定混合使用数据类型时最终结果的数据类型如在加法中混用Int和Double类型时，Scala将确定最终结果为Double类型，如下图常量在程序运行过程中值不会发生变化的量为常量或值，常

overfit同步小助手 2024-05-25 12:04:03 0 收藏

Flink保姆级教程,超详细,教学集成多个第三方工具(从入门到精通)

Flink 允许你通过实现接口来创建自定义数据源。// 定义一个自定义数据源Thread.sleep(1000) // 模拟数据生成延迟// 创建执行环境// 添加自定义数据源// 打印数据流// 启动 Flink 作业以上示例展示了如何在 Scala 中使用 Flink DataStream AP

overfit同步小助手 2024-05-25 11:03:58 0 收藏

Spark-机器学习（1）什么是机器学习与MLlib算法库的认识

从这一系列开始，我会带着大家一起了解我们的机器学习，了解我们spark机器学习中的MLIib算法库，知道它大概的模型，熟悉并认识它。同时，本篇文章为个人spark免费专栏的系列文章，有兴趣的可以收藏关注一下，谢谢。同时，希望我的文章能帮助到每一个正在学习的你们。也欢迎大家来我的文章下交流讨论，共同进

overfit同步小助手 2024-05-24 07:03:45 0 收藏

Spark-机器学习（7）分类学习之决策树

今天的文章，我们来学习分类学习之决策树，并带来简单案例，学习用法。希望大家能有所收获。同时，希望我的文章能帮助到每一个正在学习的你们。也欢迎大家来我的文章下交流讨论，共同进步。

overfit同步小助手 2024-05-23 22:04:25 0 收藏

今天来认识一下无聊的spark和scala基础理知识

Spark 应用程序计算的整个过程可以调用不同的组件，如 Spark Streaming 的实时流处理应用、SparkSQL的即席查询、BlinkDB 的权衡查询、MLlib/MLBase 的机器学习、GraphX的图处理和SparkR的数学计算等。Scala 是一种纯粹的面向对象的语言，每个值都是

overfit同步小助手 2024-04-11 04:03:26 0 收藏

IDEA软件中Scala配置安装教程（Spark计算环境搭建）

在com.atguigu.bigdata.spark.core 创建Scala class，命名为：Test ，选择object。在Java创建 new package，命名为：com.atguigu.bigdata.spark.core。print（“hello world”）进行验证，之后进行运

overfit同步小助手 2024-04-10 16:03:42 0 收藏

spark和scala环境安装与部署，有手就行

source /etc/profile使环境变量生效，接着scala -version查看是否安装成功，出现画线版本号即为成功。解压安装包 tar -zxvf /opt/scala2.12.12.tgz -C /opt/9.查看spark是否安装成功返回主目录下输入spark-submit -

overfit同步小助手 2024-04-10 05:03:52 0 收藏

Spark-Scala语言实战（11）

今天开始的文章，我会带给大家如何在spark的中使用我们的键值对方法，今天学习键值对方法中的join,rightOuterJoin,leftOuterJoin三种方法。希望我的文章能帮助到大家，也欢迎大家来我的文章下交流讨论，共同进步。

overfit同步小助手 2024-04-09 00:03:50 0 收藏

Spark-Scala语言实战（13）

今天开始的文章，我会带给大家如何在spark的中使用我们的键值对方法，今天学习键值对方法中的fullOuterJoin，zip，combineByKeyy三种方法。希望我的文章能帮助到大家，也欢迎大家来我的文章下交流讨论，共同进步。

overfit同步小助手 2024-04-08 17:03:23 0 收藏

使用Intellij idea编写Spark应用程序(Scala+SBT)

对Scala代码进行打包编译时，可以采用Maven，也可以采用SBT，相对而言，业界更多使用SBT。

overfit同步小助手 2024-04-08 14:03:25 0 收藏

Spark-Scala语言实战（10）

今天开始的文章，我会带给大家如何在spark的中使用我们的RDD方法，今天学习RDD方法中的cartesian,subtract两种方法。希望我的文章能帮助到大家，也欢迎大家来我的文章下交流讨论，共同进步。

overfit同步小助手 2024-04-08 01:03:44 0 收藏

Spark-Scala语言实战（8）

今天开始的文章，我会带给大家如何在spark的中使用我们的RDD方法，今天学习RDD方法中的flatMap,take,union三种方法。希望我的文章能帮助到大家，也欢迎大家来我的文章下交流讨论，共同进步。

overfit同步小助手 2024-04-03 19:03:39 0 收藏

Spark-Scala语言实战（9）

今天开始的文章，我会带给大家如何在spark的中使用我们的RDD方法，今天学习RDD方法中的filter,distinct,intersection三种方法，并进行一代。希望我的文章能帮助到大家，也欢迎大家来我的文章下交流讨论，共同进步。

overfit同步小助手 2024-04-03 03:03:39 0 收藏

spark 搭建及测试

（1）复制spark-defaults.conf.template,命名为spark-defaults.conf。复制spark-env.sh.template，命名为spark-env.sh。关闭spark集群?cd/usr/local/spark3/sbin/切换到spark的安装目录的sbin

overfit同步小助手 2024-04-02 17:03:51 0 收藏

2024大数据职业技能竞赛（国赛）模块B数据处理题解

第一套各节点可通过Asbru工具或SSH客户端进行SSH访问；主节点MySQL数据库用户名/密码：root/123456（已配置远程连接）；Hive的配置文件位于/opt/apache-hive-2.3.4-bin/conf/Spark任务在Yarn上用Client运行，方便观察日志。

overfit同步小助手 2024-04-02 12:03:44 0 收藏

Spark-Scala语言实战（7）

今天开始的文章，我会带给大家如何在spark的中使用我们的RDD方法，今天学习RDD方法中的map,sortby,collect三种方法。希望我的文章能帮助到大家，也欢迎大家来我的文章下交流讨论，共同进步。

overfit同步小助手 2024-04-01 10:03:50 0 收藏

Spark-Scala语言实战（6）

今天我会给大家带来如何在IDEA中导入jars包，以及使用SparkRDD，并正确使用它们同时也会给大家讲解一道实训题例。希望在本篇文章中，大家有所收获。也欢迎朋友们到评论区下一起交流学习，共同进步。

overfit同步小助手 2024-03-31 00:03:49 0 收藏

Ubuntu下安装JDK，Scala，Hadoop

ubuntu安装hodoop详细步骤_ubuntu安装hadoop-CSDN博客。

overfit同步小助手 2024-03-28 20:03:33 0 收藏