大数据 - overfit.cn

餐饮行业未来的发展趋势和前景

未来餐饮业将更加注重提供多元化的餐饮服务，如健康餐、素食餐、快餐、外卖、自助餐等，以满足不同消费者的需求。例如，通过互联网实现线上点餐、外卖订餐、餐饮评价等服务，比如传递宝APP这样的软件服务，提高餐饮服务的便捷性和效率。3.环保与可持续发展：随着全球环保和可持续发展的日益重视，未来餐饮业也将更加注

overfit同步小助手 2023-08-25 04:04:17 0 收藏

【大数据】一些基本概念

数据仓库是一个面向主题的、集成的、非易失的、随着时间变化的,用于支持管理人员决策的数据集合。数据仓库是一种专门用于分析和报告的大型结构化数据存储技术。与传统数据库不同，数据仓库通常包含历史记录和大量冗余信息，以便支持复杂的分析查询。它们通常是企业级解决方案，用于从各种源中采集和存储数据，以便进行分析

overfit同步小助手 2023-08-24 21:04:30 0 收藏

flink任务性能优化

明确指出，当前内存有限的情况下，使用rocketDB会造成性能损害，因为rocketDB会不停刷内存，造成高io和高cpu。所以在小型化项目时，对状态数据要求不高时，可考虑不使用rocketDB作为状态后端。2、将下游数据需要的数据以参数的形式向下传递。1、使用异步算子，异步执行操作。

overfit同步小助手 2023-08-24 20:03:53 0 收藏

【数仓建设系列之一】什么是数据仓库？

数据仓库是一个存储和管理大量结构化和非结构化数据的存储集合，它以主题为向导，通过整合来自不同数据源下的数据(比如各业务数据，日志文件数据等)，解决企业数据孤岛，为企业提供统一的数据视图。通过构建不同时间范围或不同业务主题下的分析报告和数据报表等，为企业决策提供一定程度上的支持和帮助。

overfit同步小助手 2023-08-24 13:03:59 0 收藏

校内大数据课题目

275【判断】HDFS中当数据节点发生故障，或者网络发生断网时，名称节点就无法收到来自一些数据节点的心跳信息，这时，这些数据节点就会被标记为“宕机”，节点上面的所有数据都会被标记为“不可读”，名称节点不会再给它们发送任何I/0请求。查询所有学生的学号、班号,查询结果根据学号按降序排列,仅显示前5个学

overfit同步小助手 2023-08-24 11:04:35 0 收藏

【大数据】Flink 详解（四）：核心篇 Ⅲ

Checkpoint 被叫做检查点，是 Flink 实现容错机制最核心的功能，是 Flink 可靠性的基石，它能够根据配置周期性地基于 Stream 中各个 Operator 的状态来生成 Snapshot 快照，从而将这些状态数据定期持久化存储下来，当 Flink 程序一旦意外崩溃时，重新运行程序

overfit同步小助手 2023-08-24 10:04:24 0 收藏

大数据Flink（五十四）：Flink用武之地

应用较多的如风控系统，当风控系统需要处理各种各样复杂的规则时，Data Driven 就会把处理的规则和逻辑写入到Datastream 的API 或者是ProcessFunction 的API 中，然后将逻辑抽象到整个Flink 引擎，当外面的数据流或者是事件进入就会触发相应的规则，这就是Data

overfit同步小助手 2023-08-24 09:04:35 0 收藏

大数据Flink（五十八）：Flink on Yarn的三种部署方式介绍

这种模式会预先在yarn或者或者k8s上启动一个flink集群，然后将任务提交到这个集群上，这种模式，集群中的任务使用相同的资源，如果某一个任务出现了问题导致整个集群挂掉，那就得重启集群中的所有任务，这样就会给集群造成很大的负面影响。通过以上两种模式的特点描述，可以看出，main方法都是在客户端执行

overfit同步小助手 2023-08-24 09:04:15 0 收藏

Hive数据仓库简介

Hive起源于Facebook，Facebook公司有着大量的日志数据，而Hadoop是实现了MapReduce模式开源的分布式并行计算的框架，可轻松处理大规模数据。然而MapReduce程序对熟悉Java语言的工程师来说容易开发，但对于其他语言使用者则难度较大。因此Facebook开发团队想设计一

overfit同步小助手 2023-08-24 07:04:22 0 收藏

flink to starrocks 问题集锦....

报如图所示：提示所示：超出内存限制，生产上不知道BE设置了多少。

overfit同步小助手 2023-08-24 03:03:51 0 收藏

大数据Flink（六十四）：Flink运行时架构介绍

TaskManager 启动之后，JobManager 会与它建立连接，并将作业图（JobGraph）转换成可执行的“执行图”（ExecutionGraph）分发给可用的 TaskManager，然后就由 TaskManager 具体执行任务。从以 Greenplum 为代表的 MPP（Massiv

overfit同步小助手 2023-08-23 23:04:17 0 收藏

美团买菜基于 Flink 的实时数仓建设

overfit同步小助手 2023-08-23 22:04:36 0 收藏

黑马大数据学习笔记2-HDFS环境部署

HDFS环境部署

overfit同步小助手 2023-08-23 15:03:48 0 收藏

工资总额分配方案

工资总额分配是与企业人力资源战略紧密联系的管理要素。建立一套科学、合理的工资总额分配方案，对国有企业而言至关重要。本文运用了灰色关联、标准回归系数、Spearman相关系数、逐步回归等分析方法，以某国有企业2020年26个省市分公司年运营的统计数据作为研究对象，综合考虑工资分配的影响因素，通过建立多

overfit同步小助手 2023-08-23 10:04:23 0 收藏

DophineSheduler上下游任务之间动态传参案例及易错点总结

本文总结了DophineSheduler上下游任务之间参数传递的方法，并对其中的易错点进行了梳理，同时给出了具体参数传递的案例，读者可自行进行摸索。

overfit同步小助手 2023-08-23 08:04:26 0 收藏

【大数据】Flink 详解（一）：基础篇

Flink 是一个以流为核心的高可用、高性能的分布式计算引擎。具备流批一体，高吞吐、低延迟，容错能力，大规模复杂计算等特点，在数据流上提供数据分发、通信等功能。

overfit同步小助手 2023-08-23 08:04:20 0 收藏

深入理解MapReduce：使用Java编写MapReduce程序【上进小菜猪】

本文介绍了MapReduce的原理和使用Java编写MapReduce程序的方法。MapReduce是一个强大的并行编程模型，可用于处理大规模数据集。如果你正在处理大数据集，那么MapReduce可能是你的首选方案。

overfit同步小助手 2023-08-23 05:04:14 0 收藏

【hadoop】windows上hadoop环境的搭建步骤

在大数据开发领域中，不得不说说传统经典的hadoop基础计算框架。一般我们都会将hadoop集群部署在服务器上，但是作为一个资深搬砖人，我们本地环境也需要一个开发hadoop的开发环境。那么，今天就安排一个在windows上搭建一个hadoop环境。

overfit同步小助手 2023-08-23 04:03:58 0 收藏

2.Flink应用

2.1 数据流DataStream：DataStream是Flink数据流的核心抽象，其上定义了对数据流的一系列操作 DataStreamSource：DataStreamSource 是 DataStream 的起点， DataStreamSource 在StreamExecutionEnv

overfit同步小助手 2023-08-23 00:04:22 0 收藏

基于Hadoop的疫情信息分析与可视化研究——包含大屏可视化及预测算法

基于Hadoop的疫情信息分析与可视化研究在国内外都有较为广泛的应用。国外研究主要集中在疫情数据的处理和分析，以及疫情预测模型的构建。而国内研究则主要集中在疫情数据的可视化和知识图谱的构建。未来，基于Hadoop的疫情信息分析与可视化研究还有很大的发展空间，可以进一步提高对疫情的监测和预警能力，为政

overfit同步小助手 2023-08-22 22:04:15 0 收藏