大数据 Scala - overfit.cn

Spark算子-Scala版本头歌答案

overfit同步小助手 2023-04-15 12:03:46 0 收藏

从Hive源码解读大数据开发为什么可以脱离SQL、Java、Scala

本文将以大数据开发中最常见的数仓组件Hive的drop table为例，抛砖引玉，解读为神马大数据开发可以脱离SQL、Java、Scala。

overfit同步小助手 2023-04-11 07:03:39 0 收藏

快速体验 Flink Table Store 入门篇

在本地安装单机版本，能够实现快速体验 Flink Table Store 的目的，本文以 Flink 1.15.2、flink-table-store-dist-0.2.1 和 flink-shaded-hadoop-2-uber-2.8.3-10.0 为例，系统为 Centos 3.10。

overfit同步小助手 2023-04-06 11:04:31 0 收藏

Spark框架概述

定义：Apache Spark是用于处理的。弹性分布式数据集RDD是一种分布式内存抽象，其使得程序员能够在大规模集群中做内存运算，并且有一定的容错方式。而这也是整个Spark的核心数据结构，Spark整个平台都围绕着RDD进行。简而言之，Spark借鉴了MapReduce 思想发展而来，保留了其分布

overfit同步小助手 2023-04-06 09:04:28 0 收藏

第5章 Spark 核心编程

大数据自学笔记——spark学习笔记

overfit同步小助手 2023-04-05 15:04:31 0 收藏

Spark-序列化、依赖关系、持久化

overfit同步小助手 2023-04-04 23:04:45 0 收藏

解决kafka启动成功后然后又关闭了的问题

如果不知道的自己的kafka的log.Dirs路径，可以去kafka的config目录下的servers.properties。如果不知道cluster.id值，可以去kafka的日志目录中查看报错信息，里面有cluster_id。原因：可能是meta.properties中cluster_id值有

overfit同步小助手 2023-04-04 23:04:13 0 收藏

如何将spark程序打jar包并上传至本地集群环境运行

如何将spark程序打jar包，并上传至本地集群环境运行

overfit同步小助手 2023-04-04 18:04:22 0 收藏

IDEA中Spark配置

Spark快速配置

overfit同步小助手 2023-04-04 15:04:26 0 收藏

windonws下spark的安装(最新安装)

spark超详细安装步骤（1）针对于不可写问题，只要它下面已经说明已经安装或安装成功便可忽略；（2）对于没有“py4j”库的问题，通过pip install py4j==0.10.9.5 即可添加。

overfit同步小助手 2023-04-04 05:04:24 0 收藏

编写 Scala 工程代码，将 MySQL 库中的表增量抽取到 Hive库中对应表中

本文仅仅简单介绍了操作步骤，很多经验都来自于b站和博客上的大佬，以及身边的同学和老师转化而来的，赶在2022年最后一天做出总结，希望对大家也有帮助。

overfit同步小助手 2023-04-03 19:04:25 0 收藏

Scala 一文搞定

Apache Spark 是专为大规模数据快速实时处理的计算引擎/内存级大数据计算框架。Apache Spark 是由Scala 语言编写。

overfit同步小助手 2023-04-03 18:04:36 0 收藏

【大数据入门核心技术-Spark】（七）执行Spark任务的两种方式:spark-submit和spark-shell

引入：spark-shell交互式编程确实很方便我们进行学习测试，但是在实际中我们一般是使用IDEA开发Spark应用程序打成jar包交给Spark集群/YARN去执行，所以我们还得学习一个spark-submit命令用来帮我们提交jar包给spark集群/YARN。引入：之前我们使用提交任务都是使

overfit同步小助手 2023-04-02 17:04:05 0 收藏

Spark - 介绍及使用 Scala、Java、Python 三种语言演示

分布式机器学习的框架，可以使用许多常见的机器学习和统计算法，例如：支持向量机、回归、线性回归、逻辑回归、决策树、朴素贝叶斯、汇总统计、相关性、分层抽样、假设检定、随即数据生成等，简化大规模机器学习。的快速调度能力来运行流分析，通过时间窗口截取小批量的数据并可以对之运行。类似，Spark

overfit同步小助手 2023-04-02 09:04:17 0 收藏

windows搭建spark环境

windows 安装spark ，scala（spark需要scala环境），spark，hadoop 安装

overfit同步小助手 2023-04-02 02:04:38 0 收藏

Scala的安装与配置

Scala安装配置及介绍一、为什么要学Scala1. Scala介绍Scala基于JVM，和Java完全兼容，同样具有跨平台、可移植性性好、方便的垃圾回收等特性是一门函数式编程语言Scala更适合大数据的处理Scala对集合类型数据处理有非常好的支持spark的底层用Scala编写2. Scala特

overfit同步小助手 2023-04-01 14:04:27 0 收藏

Scala 基础（三）：运算符和流程控制

Scala中的运算符和Java中的运算符基本相同。算术运算，和在一元运算表中示正号和负号，在二元运算中表示加和减。表示整除，只保留整数部分舍弃掉小数部分除此之外，也表示两个字符串相加关系运算逻辑运算赋值运算位运算在 Scala 中其实是没有运算符的，所有运算符都是方法的调用。举个栗子：二、流程控制

overfit同步小助手 2023-04-01 12:04:15 0 收藏

spark 安装详细步骤

3、在目录/home/hadoop/software下解压：tar -zxvf spark-1.6.2-bin-hadoop2.6.tgz。4、进入conf目录,复制文件cp spark-env.sh.template spark-env.sh。6、cd 切换到sbin目录下使用 ./start-a

overfit同步小助手 2023-04-01 10:04:30 0 收藏

详解Kafka 3.0 稳定版新特性

Kafka 2.8.0正式发布了KRaft的先行版，并且支持在KRaft模式下的部署和运行。KRaft模式下的Kafka可以完全脱离Zookeeper运行，使用自己的基于Raft算法实现的quorum来保证分布式Metadata的一致

overfit同步小助手 2023-04-01 03:04:51 0 收藏

Flink学习:Flink常见报错

flink error

overfit同步小助手 2023-03-31 15:04:57 0 收藏