大数据 - overfit.cn

Git的基本操作（安装Git，创建本地仓库，配置Git，添加、修改、回退、撤销修改、删除文件）

这篇文章主要介绍了Git的一些基本操作，安装Git，创建本地仓库，配置Git，git add 和 git commit 文件，对文件进行修改，版本回退，以及如何撤销修改和删除文件，让我们对Git有初步的了解，能进行简单的版本管理。

overfit同步小助手 2024-03-18 09:04:28 0 收藏

Hadoop-Yarn-NodeManager是如何启动容器的

从源码了解Hadoop-Yarn-NodeManager是如何启动容器的

overfit同步小助手 2024-03-18 09:03:58 0 收藏

“大数据&人工智能”驱动的空间天气科研范式变革初步探索

人工智能拥有强大的能力，但目前在空间天气领域应用的大部分模型是黑箱，少部分是灰箱，对于科学研究领域来说缺乏可解释性，对于为什么产生这样的结果、其中的因果关系如何、背后的物理机制如何等无法给出合理的解释，因此在科学性上受到较多的质疑。经过过去多年的研究，人类已经对其中特定空间区域的特定现象、特定事件规

overfit同步小助手 2024-03-18 05:03:37 0 收藏

【大数据】Flink SQL 语法篇（十）：EXPLAIN、USE、LOAD、SET、SQL Hints

如果熟悉 MySQL 的同学会非常熟悉这个子句，在 MySQL 中，USE 子句通常被用于切换库，那么在 Flink SQL 体系中，它的作用也是和 MySQL 中 USE 子句的功能基本一致，用于切换 Catalog，DataBase，使用 Module。

overfit同步小助手 2024-03-18 04:03:50 0 收藏

拿什么样的大数据来“喂饱”狂飙的大模型

大数据产业创新服务媒体——聚焦数据· 改变商业当前，大模型的发展处于一场充满无限可能的大变革前夜，而作为核心要素的大数据也被赋予了全新的意涵。大模型技术的出现对大数据而言意味着什么，大数据又将如何影响大模型的发展，这两者又如何能更好双向奔赴，带来新质生产力，进入2024年又会出现哪些技术的引爆点和杀

overfit同步小助手 2024-03-18 03:03:43 0 收藏

数据上线，评测开启！2024 6G无线通信AI大赛正式开战！

2024 6G无线通信AI大赛正式开战！

overfit同步小助手 2024-03-18 03:01:10 0 收藏

Flink广播流 BroadcastStream

Flink中的广播流（BroadcastStream）是一种特殊的流处理方式，它允许将一个流（通常是一个较小的流）广播到所有的并行任务中，从而实现在不同任务间共享数据的目的。广播流在处理配置信息、小数据集或者全局变量等场景下特别有用，因为这些数据需要在所有任务中保持一致且实时更新。定义MapStat

overfit同步小助手 2024-03-18 02:03:30 0 收藏

Zookeeper与ApacheSpark的实现与应用

Zookeeper与ApacheSpark的实现与应用作者：禅与计算机程序设计艺术背景介绍分布式系统的发展近年来，随着互联网和物联网的快速发展，分布式系统的应用也变得越来越普遍。分布式系统是指由多个节点组

overfit同步小助手 2024-03-18 01:03:33 0 收藏

数据仓库原理（二）

本文介绍数据仓库的概念模型、逻辑模型和物理模型。

overfit同步小助手 2024-03-17 23:03:44 0 收藏

【项目实战】基于Spark大数据的餐饮外卖数据分析可视化系统hadoop项目hive计算机程序设计

overfit同步小助手 2024-03-17 22:03:51 0 收藏

大数据入门之hadoop学习

大数据通常指的是数据集规模非常庞大且难以在常规数据库和数据处理工具中有效处理的数据。

overfit同步小助手 2024-03-17 21:03:43 0 收藏

Elasticsearch 通过索引阻塞实现数据保护深入解析

例如，你可以调整带有写入阻塞的索引的设置，但不能调整带有read_only阻塞的索引的设置。例如，你可以调整带有写入阻塞的索引的设置，但不能调整带有read_only阻塞的索引的设置。这些阻塞可以通过动态索引设置添加或移除，也可以通过专门的API来添加，这样做的好处是能确保在添加写入阻塞后，所有索引

overfit同步小助手 2024-03-17 19:06:16 0 收藏

技术精英求职必备：大数据研发工程师简历模板

在当今数据驱动的时代，成为一名优秀的大数据研发工程师意味着站在技术发展的前沿。本文提供了专为大数据研发工程师设计的未来简历模板和撰写指南。文章详细介绍了如何在简历中高效展示技术能力、项目经验和数据分析技巧，以适应不断变化的行业需求。我们强调了将复杂数据技能以清晰、有条理的方式呈现的重要性，并提供了创

overfit同步小助手 2024-03-17 19:03:49 0 收藏

Hadoop、MapReduce、Spark

优缺点优点：1.易于编程 — 底层实现了接口2.良好的扩展性 — 可增加节点3.高容错性 — 保证任务的完成4.适合PB级别以上的海量数据的离线处理 — 可实现服务器内节点并发工作缺点：1.不擅长实时计算 — 无法做到毫秒或者秒级内返回结果2.不擅长流式计算 — MR 的输入数据集是静态的，流式计算

overfit同步小助手 2024-03-17 14:03:54 0 收藏

初识Hadoop

大数据的特征数据化结构与非数据化结构Hadoop

overfit同步小助手 2024-03-17 14:03:23 0 收藏

实时大数据在各个领域的应用

在过去的几年里，大数据一直在大多数行业中扮演着改变游戏规则的角色。据Wikibon称，全球大数据软件和服务市场收入预计将从2018年的420亿美元增加到2027年的1030亿美元，复合年增长率（CAGR）为10.48%。这就是为什么大数据是行业中最受关注的技能之一。在这篇大数据应用的博客中，我将带你

overfit同步小助手 2024-03-17 10:03:54 0 收藏

赛事 Q＆A × 培训预告：2024 年（第 17 届）中国大学生计算机设计大赛大数据主题赛正式开赛！

和鲸始终贯彻大赛“以赛促学、以赛促教、以赛促创”的精神与理念，为参赛师生提供多层面、多角度、全方位的工作支持，作为协办方，衷心期待本届中国大学生计算机设计大赛能够涌现出更多的优秀作品。

overfit同步小助手 2024-03-17 10:03:48 0 收藏

Flink入门（四）——编程模型

flink是一款开源的大数据流式处理框架，他可以同时批处理和流处理，具有容错性、高吞吐、低延迟等优势，本文简述flink的编程模型。数据集类型：无穷数据集：无穷的持续集成的数据集合有界数据集：有限不会改变的数据集合常见的无穷数据集有：用户与客户端的实时交互数据应用实时产生的日志金融市场的实时交易记录

overfit同步小助手 2024-03-17 10:03:44 0 收藏

HIVE面试问题

hive面试问题

overfit同步小助手 2024-03-17 10:03:41 0 收藏

你想月薪上万吗？你想左拥右抱吗？如果你想请开始学习--Hadoop

根据服务对象和层次分为：数据来源层、数据传输层、数据存储层、资源管理层、数据计算层、任务调度层、业务模型层。接下来对Hadoop生态圈中出现的相关组件做一个简要介绍。Spark是一种快速、通用、可扩展的大数据分析引擎，2009年诞生于加州大学伯克利分校AMPLab，2010年开源，2013年6月成为

overfit同步小助手 2024-03-17 10:03:30 0 收藏