大数据 - overfit.cn

智慧工地全套源码，微服务+Java+Spring Cloud +UniApp +MySql；支持多端展示（大屏端、PC端、手机端、平板端）演示+自主版权。智慧工地概念：智慧工地就是互联网+建筑工地，是将互联网+的理念和技术引入建筑工地，然后以物联网、移动互联网技术为基础，充分应用BIM、大数据、人工

overfit同步小助手 2024-01-09 11:07:01 0 收藏

Hadoop-3.3.6完全分布式集群搭建

右击创建好的虚拟机hadoop base，选择管理-克隆-点击下一步-虚拟机中的当前状态-下一步-创建完整克隆-下一步-设置克隆机名称，安装位置-完成。设置静态ip，与主节点ljl的hosts文件保持一致，设置成功重启网络。首先进入hadoop所在配置文件目录/usr/local/src/Hadoo

overfit同步小助手 2024-01-09 10:03:20 0 收藏

【ScalaTest系列1】使用ScalaTest进行单元测试步骤实用指南【建议收藏】

ScalaTest是一个功能强大的测试框架，支持多种不同的测试风格。本指南将帮助您快速入门ScalaTest。

overfit同步小助手 2024-01-09 08:05:30 0 收藏

如何在Flink SQL中轻松实现高效数据处理：最佳实践揭秘Protobuf自定义格式

在Flink SQL中，自定义数据格式是一个强大的功能，它允许用户将外部系统中的数据以特定的格式读取到Flink中，并在Flink SQL中进行处理。本文将结合提供的链接内容，探讨如何在Flink SQL中自定义Protobuf格式，并介绍其背后的原理和实现过程。

overfit同步小助手 2024-01-09 05:03:56 0 收藏

Spark编程实验三：Spark SQL编程

本实验的目的是掌握Spark SQL的基本编程方法，熟悉RDD到DataFrame的转化方法，熟悉利用Spark SQL管理来自不同数据源的数据。

overfit同步小助手 2024-01-09 02:03:45 0 收藏

Spark 基本知识介绍

spark基本概念理解

overfit同步小助手 2024-01-08 23:03:40 0 收藏

[spark] RDD, DataFrame和DataSet是什么?如何相互转化

简而言之，RDD 是最基本的抽象，DataFrame 是对结构化数据的更高层次抽象，而 Dataset 是在 DataFrame 基础上提供了类型安全性的扩展。在实际使用中，通常优先选择使用 DataFrame 或 Dataset，因为它们更适合进行结构化数据处理和利用 Spark 的优化能力。在

overfit同步小助手 2024-01-08 22:03:48 0 收藏

从零开始了解大数据(二)：Hadoop篇

Hadoop是一个开源的分布式计算框架，主要用于处理大规模数据集。本文将介绍Hadoop集群的主要组成部分，包括HDFS分布式文件系统和YARN资源管理器，并探讨它们在大数据处理中的作用和功能。

overfit同步小助手 2024-01-08 20:03:34 0 收藏

Flink cdc3.0同步实例（动态变更表结构、分库分表同步）

基于 Flink CDC 3.0 同步 MySQL 到 Doris ，来体验整库同步、表结构变更同步和分库分表同步等功能。

overfit同步小助手 2024-01-08 19:03:26 0 收藏

字节跳动 Spark 支持万卡模型推理实践

在云原生化的发展过程中 Kubernetes 由于其强大的生态构建能力和影响力，使得包括大数据、AI 在内越来越多类型的负载应用开始向 Kubernetes 迁移，字节内部探索 Spark 从 Hadoop 迁移到 Kubernetes 对作业的云原生化运行。字节跳动的大数据资源管理架构和 Spar

overfit同步小助手 2024-01-08 17:03:40 0 收藏

一百八十二、大数据离线数仓完整流程——步骤一、用Kettle从Kafka、MySQL等数据源采集数据然后写入HDFS

大数据离线数仓完整流程——步骤一、用Kettle从Kafka、MySQL等数据源采集数据然后写入HDFS

overfit同步小助手 2024-01-08 17:03:34 0 收藏

大数据平台/大数据技术与原理-实验报告--部署ZooKeeper集群和实战ZooKeeper

在上步修改配置文件zoo.cfg中，将存放数据快照和事务日志的目录设置为目录data和datalog，因此需要在master机器上创建这两个目录，使用如下命令实现，假设当前目录为以上步骤操作后的所在目录“/opt/so/apache-zookeeper-3.9.1-bin”。由于ZooKeeper集

overfit同步小助手 2024-01-08 12:03:38 0 收藏

计算机毕业设计：基于python热门旅游景点数据爬取分析系统+可视化 +大数据（附源码+文档）✅

overfit同步小助手 2024-01-08 11:03:34 0 收藏

大数据编程期末大作业2023

利用新媒体平台，彩妆化妆工具市场如何挖掘潜在客户

数据仓库BW与大数据平台，到底如何取舍？

spark与scala的对应版本查看

Flink实时电商数仓（九）

认识Git

Hadoop YARN CGroup 实践

java智慧工地源码，互联网+建筑工地，实现对工程项目内人员、车辆、安全、设备、材料等的智能化管理