Spark - overfit.cn

哈工大大数据分析大作业

PDF版报告请见github地址：https://github.com/xrervip/HIT_BigDataAnalysisProject第1章需求分析 3******1.1 研究问题的背景 31.2 问题的需求分析 31.3 研究问题的挑战 4第二章系统设计 4**2.1 apriori算法

overfit同步小助手 2023-06-11 12:04:13 0 收藏

RDD的创建头歌答案

overfit同步小助手 2023-06-10 15:04:02 0 收藏

实验7 Spark初级编程实践

1. Spark读取文件系统的数据2.编写独立应用程序实现数据去重对于两个输入文件A和B，编写Spark独立应用程序（推荐使用Scala语言），对两个文件进行合并，并剔除其中重复的内容，得到一个新文件C。下面是输入文件和输出文件的一个样例，供参考。3.编写独立应用程序实现求平均值问题每个输入文件表示

overfit同步小助手 2023-06-08 23:04:03 0 收藏

Hudi-集成Spark之spark-sql方式

hudi 支持使用 bulk_insert 作为写操作的类型，只需要设置两个配置：hoodie.sql.bulk.insert.enable 和 hoodie.sql.insert.mode。（5）通过 CTAS (Create Table As Select)建表为了提高向 hudi 表加载数据的

overfit同步小助手 2023-06-08 18:03:58 0 收藏

Spark项目实战—电商用户行为分析

利用spark分析电商用户行为

overfit同步小助手 2023-06-07 07:03:39 0 收藏

Spark中RDD、DataFrame和DataSet的区别与联系

RDD代表弹性分布式数据集。它是记录的只读分区集合。RDD是Spark的基本数据结构。它允许程序员以容错方式在大型集群上执行内存计算。与RDD不同，数据以列的形式组织起来，类似于关系数据库中的表。它是一个不可变的分布式数据集合。Spark中的DataFrame允许开发人员将数据结构(类型)加到分布式

overfit同步小助手 2023-06-06 01:03:51 0 收藏

大数据技术（入门篇）--- 使用Spring Boot 操作 CDH6.2.0 Spark SQL进行离线计算

Spring Boot 操作 CDH6.2.0集群中的 Spark，使用Spark-SQL技术，实现离线计算，查询示例：简单的条件查询、稍微复杂一些的聚合查询、每行数据对象，转换为自定义Class对象、目标数据存储到MySQL数据库中、符合断言判断

overfit同步小助手 2023-06-05 23:03:52 0 收藏

【Kafka+Flume+Mysql+Spark】实现新闻话题实时统计分析系统（附源码）

overfit同步小助手 2023-06-05 20:03:55 0 收藏

5.1 Spark的安装与使用

第一关 Scala语言开发环境的部署 1.下载解压在Scala官网根据平台选择下载Scala的安装包scala-2.17.7.tgz解压到/app目录下：mkdir /app //创建 app 目录cd /opttar -zxvf scala-2.12.7.tgz -C /appeducode

overfit同步小助手 2023-06-05 17:04:15 0 收藏

漏洞复现：Apache Spark 命令注入（CVE-2022-33891）

ApacheSparkUI可以设置选项spark.acls.enable启用ACL，使用身份验证过滤器。用以检查用户是否具有查看或修改应用程序的访问权限。如果启用了ACL则HttpSecurityFilter中的代码路径可以允许用户通过提供任意用户名来执行命令。该功能最终将根据用户输入构建一个Uni

overfit同步小助手 2023-06-03 10:07:24 0 收藏

数据库审核工具SQLE部署及使用

点击上方蓝字关注我SQLE（ https://opensource.actionsky.com/sqle/ ）是由上海爱可生信息技术股份有限公司开发并开源，支持多场景审核，支持标准化上线流程，原生支持 MySQL 审核且数据库类型可扩展的 SQL 审核工具。我们可以基于此工具进行数据库SQL审核，

overfit同步小助手 2023-06-02 18:03:44 0 收藏

基于Spark的电影推荐系统实现

受某视频网站委托，需开发一套基于Spark的大数据机器学习系统，应用协同过滤算法对网站客户进行电影推荐。本案例所使用的数据集说明如下：评分数据集：/data/dataset/ml/movielens/ratings.csv 电影数据集：/data/dataset/ml/movielens/mo

overfit同步小助手 2023-06-02 16:03:45 0 收藏

实验7 Spark初级编程实践

1.实验目的（1）掌握使用Spark访问本地文件和HDFS文件的方法（2）掌握Spark应用程序的编写、编译和运行方法2.实验平台（1）操作系统：Ubuntu18.04（或Ubuntu16.04）；（2）Spark版本：2.4.0；（3）Hadoop版本：3.1.3。3.实验步骤（1）Spark读取

overfit同步小助手 2023-06-02 01:03:37 0 收藏

【大数据学习篇6】 Spark操作统计分析数据操作

8| 53.0| 53.0| 浙江省|2020-02-20 23:56:12|2020-02-20 23:56:16| 0.0|| 11|267.9| 0.0| 北京|2020-02-20 23:54:24|2020-02-20 23:54:31| 267.9||

overfit同步小助手 2023-05-31 06:03:51 0 收藏

《Spark大数据技术与应用》肖芳张良均著——课后习题

overfit同步小助手 2023-05-30 03:02:13 0 收藏

大数据学习（七）一分钟了解数据建模

数据建模 ER建模维度建模

overfit同步小助手 2023-05-29 17:03:58 0 收藏

educoder-Spark机器学习

头歌Spark机器学习实训答案代码

overfit同步小助手 2023-05-29 15:03:55 0 收藏

spark-sql字段级血缘关系实现

spark-sql 表字段血缘关系可视化案例

overfit同步小助手 2023-05-28 17:04:08 0 收藏

spark法律服务大数据智能推荐（自己动手做的，完整过程+源码）

与搜索引擎不同，推荐系统并不需要用户提供明确的需求，而是通过分析用户的历史行为，主动为用户推荐能够满足他们兴趣和需求的信息。为了能够更好地满足用户需求，需要依据其网站的海量数据，研究用户的兴趣偏好，分析用户的需求和行为，发现用户的兴趣点，从而引导用户发现自己的信息需求，将长尾网页（长尾网页是指网页的

overfit同步小助手 2023-05-26 20:04:39 0 收藏

Spark on Yarn 部署模式运行常用参数和认证参数理解

spark 提交任务参数说明

overfit同步小助手 2023-05-26 14:03:55 0 收藏

哈工大大数据分析大作业

RDD的创建头歌答案

实验7 Spark初级编程实践

Hudi-集成Spark之spark-sql方式

Spark项目实战—电商用户行为分析

Spark中RDD、DataFrame和DataSet的区别与联系

大数据技术（入门篇）--- 使用Spring Boot 操作 CDH6.2.0 Spark SQL进行离线计算

【Kafka+Flume+Mysql+Spark】实现新闻话题实时统计分析系统（附源码）

5.1 Spark的安装与使用

漏洞复现：Apache Spark 命令注入（CVE-2022-33891）

数据库审核工具SQLE部署及使用

基于Spark的电影推荐系统实现

实验7 Spark初级编程实践

【大数据学习篇6】 Spark操作统计分析数据操作

《Spark大数据技术与应用》肖芳张良均著——课后习题

大数据学习（七）一分钟了解数据建模

educoder-Spark机器学习

spark-sql字段级血缘关系实现

spark法律服务大数据智能推荐（自己动手做的，完整过程+源码）

Spark on Yarn 部署模式运行常用参数和认证参数理解

作者榜

资讯小助手

内容小助手

Deephub

奕凯