大数据 - overfit.cn

Spark--一文了解WebUI

日常工作中经常用到sparkui来排查一些问题，有些东西需要经常搜索，网上的文章有写的很棒的，也有写的一言难尽的，这里参考了其他大佬的文章，自己整体梳理了一下，方便自己使用，也希望能帮助到大家～

overfit同步小助手 2024-02-01 09:04:34 0 收藏

城市内涝积水监测系统作用，实时预警城市安全

国产存储芯片和大于12种抗干扰算法，120，000条储存数据黑匣，10米水位量程、1纳米级水位精度，组合而成的第四代城市生命线内涝积水监测仪，全天候进行监测，涵盖了绝大部分的应用场景：如隧道内、易涝点、河道水位等。城市内涝治理涉及住建、水务、应急、环保、民政、公安等多部门责权关系，且内涝防治决策时间

overfit同步小助手 2024-02-01 06:06:52 0 收藏

Flink原理之分布式分发

Flink集群是由一个JobManager和多个TaskManager组成的：Client用来提交任务给JobManager，JobManager分发任务给TaskManager去执行，然后TaskManager会以心跳的方式汇报任务状态。容易获得更好的资源利用。TaskSlot即任务槽，是Task

overfit同步小助手 2024-02-01 05:03:28 0 收藏

AI大模型应用入门实战与进阶：构建你的第一个大模型：实战指南

AI大模型是指具有大量参数和复杂结构的人工智能模型。这些模型通常需要大量的计算资源和数据来进行训练，以实现高性能的预测和生成能力。近年来，随着计算能力的提高和数据量的增加，AI大模型在各种任务中取得了显著的成果，如自然语言处理、计算机视觉和强化学习等。模型压缩与加速：随着模型规模的增加，计算资源和存

overfit同步小助手 2024-02-01 02:01:33 0 收藏

The Future of Big Data Processing: Apache NiFi and Beyon

1.背景介绍大数据处理是现代科技世界中最热门的话题之一。随着互联网的普及和数字化的推进，数据的产生和存储量不断增加，这导致了传统数据处理方法不能满足需求的问题。为了解决这个问题，人工智能科学家、计算机科学家和大数据技术专家不断地发展新的算法和框架，以提高数据处理的效率和准确性。在这篇文章中，我们将讨

overfit同步小助手 2024-02-01 00:03:38 0 收藏

如何在大数据领域实现高效的存储解决方案

1.背景介绍大数据是指由于互联网、物联网等技术的发展，数据量大、增长迅速、多样化、实时性强的数据集。大数据处理的核心问题是如何高效地存储这些数据。高效的存储解决方案能够有效地减少存储成本，提高数据访问速度，提升数据处理能力，从而实现大数据的高效处理和分析。在大数据领域，存储技术的发展受到了高效存储的

overfit同步小助手 2024-02-01 00:03:17 0 收藏

【flink番外篇】9、Flink Table API 支持的操作示例（2）-完整版

一、Flink 专栏Flink 专栏系统介绍某一知识点，并辅以具体的示例进行说明。1、Flink 部署系列本部分介绍Flink的部署、配置相关基础内容。2、Flink基础系列本部分介绍Flink 的基础部分，比如术语、架构、编程模型、编程指南、基本的datastream api用法、四大基石等内容。

overfit同步小助手 2024-01-31 23:03:16 0 收藏

大数据与人工智能：改变交通运输行业的未来

1.背景介绍交通运输行业是现代社会的重要组成部分，它为人们提供了方便快捷的出行方式。然而，随着人口增长和城市发展，交通拥堵、交通事故、交通拥堵等问题日益严重，对于交通运输行业的发展产生了重大影响。因此，在这种背景下，大数据和人工智能技术在交通运输行业中发挥着越来越重要的作用。大数据是指由于现代信息技

overfit同步小助手 2024-01-31 23:01:30 0 收藏

实时Flink的异常处理与故障恢复

1.背景介绍在大数据处理领域，实时流处理是一项至关重要的技术，能够实时处理大量数据，提高数据处理效率。Apache Flink是一个流处理框架，具有高性能、低延迟和容错性等优点。在实际应用中，异常处理和故障恢复是非常重要的，可以确保系统的稳定运行。本文将从以下几个方面进行阐述：背景介绍核心概念与联系

overfit同步小助手 2024-01-31 22:03:43 0 收藏

大数据- Hadoop入门

Hadoop是一个对大量数据进行分布式处理的。

overfit同步小助手 2024-01-31 21:03:31 0 收藏

大数据毕业设计选题推荐-系统运行情况监控系统-Hadoop-Spark-Hive

随着信息化时代的快速发展，大数据技术广泛应用于各个领域，包括金融、政务、教育等。在大数据系统的运行过程中，系统运行情况监控系统显得尤为重要。它可以帮助我们更好地理解数据，预判潜在风险，提高系统稳定性，进一步优化系统性能。因此，本课题旨在研究一个基于大数据的系统运行情况监控系统，解决现有解决方案存在的

overfit同步小助手 2024-01-31 21:03:11 0 收藏

Flink窗口（2）—— Window API

本文介绍了Flink窗口的Window API内容，包括窗口分配器以及窗口函数两部分

overfit同步小助手 2024-01-31 20:03:30 0 收藏

【数据仓库与联机分析处理】多维数据模型

数据仓库和OLAP工具是基于多维数据模型的，该模型以数据立方体（Cube）的形式来观察和分析数据。本篇文章介绍多维数据模型。

overfit同步小助手 2024-01-31 17:03:46 0 收藏

大数据在智能能源管理中的发展趋势与机遇

1.背景介绍智能能源管理是一种利用大数据、人工智能和互联网技术来优化能源生产、分发和消费的方法。在全球气候变化和能源短缺的背景下，智能能源管理已经成为各国政府和企业的关注焦点。智能能源管理涉及到电力、燃气、水、交通等多个领域，其中电力是最为关键和核心的一环。在过去的几十年里，电力系统一直以传统的中央

overfit同步小助手 2024-01-31 15:03:20 0 收藏

3分钟带你了解：数据仓库能为你做点啥

数据仓库的建设目标，是融合多领域数据，建设企业级标准化、统一、可共享的全、准、快、省、通的全部数据体系，給下游提供稳定数据服务。，指经过一系列的业务逻辑、技术逻辑加工后的，产生的口径统一的公共数据，具备高质量、高时效、一致口径等特性，常用于运营报表、经营分析、财务结算、风控策略等场景；灵活的查询，可

overfit同步小助手 2024-01-31 13:03:45 0 收藏

虚拟机集群部署hadoop

5.关闭防火墙（root下执行）systemctl stop firewalldsystemctl disable firewalld6.配置普通用户（xiaoyi）具有root权限（root下执行）vim /etc/sudoers修改/etc/sudoers文件，找到%wheel下面添加一行：##

overfit同步小助手 2024-01-31 12:03:48 0 收藏

可解释性AI技术在安全领域的应用

1.背景介绍在当今的数字时代，安全性已经成为了人类社会中最关键的问题之一。随着人工智能(AI)技术的不断发展和进步，人们越来越依赖于AI系统来处理和解决各种安全问题。然而，这也为我们带来了一个新的挑战：如何确保这些AI系统的安全性和可靠性？这就是可解释性AI技术在安全领域的重要性所在。可解释性AI技

overfit同步小助手 2024-01-31 11:07:12 0 收藏

大数据篇|Hadoop发展史及介绍

一、Hadoop介绍1.1、Hadoop是什么二、Hadoop发展史2.1、创始人2.2、Hadoop发展历史/起源2.3、Hadoop三大发行版本2.3.1、Apache Hadoop2.3.2、Cloudera Hadoop2.3.3、Hortonworks Hadoop三、Hadoop组成3.

overfit同步小助手 2024-01-31 10:03:57 0 收藏

全国职业院校技能大赛-大数据离线数据处理模块-指标计算

指标计算部分的难点就是多表查询的部分已经开窗函数的合理运用，因此熟练掌握HiveSQL中高级函数的部分是非常重要的

overfit同步小助手 2024-01-31 08:03:49 0 收藏

Flink CDC 3.0 详解

Flink CDC 是基于数据库日志 CDC（Change Data Capture）技术的实时数据集成框架，支持全增量一体化、无锁读取、并行读取、表结构变更自动同步、分布式架构等高级特性。配合Flink 优秀的管道能力和丰富的上下游生态，Flink CDC 可以高效实现海量数据的实时集成。Flin

overfit同步小助手 2024-01-31 05:03:34 0 收藏