大数据 - overfit.cn

TDEngine(taos) 涛思数据库-sql初识

overfit同步小助手 2024-09-10 17:02:33 0 收藏

Spark-Job启动、Stage划分

1、线性解析程序中的代码，遇到Action算子调用SparkContext的runJob()，有几个Action算子就会产生几个Job2、转交给DAGScheduler提交Job3、DAGScheduler先为调用Action算子的RDD创建一个ResultStage。

overfit同步小助手 2024-09-10 15:03:41 0 收藏

2024年7月117篇代码大模型论文最全整理

干货满满~

overfit同步小助手 2024-09-10 15:03:35 0 收藏

大数据Flink（一百一十五）：Flink SQL的基本概念

因为这个表的元数据没有被持久化。那么在这个 Flink session 中，你的任务访问到这个表时，访问到的永远是临时表（即相同名称的表，临时表会屏蔽永久表）。在这个作业中，订单表作为驱动源表输入，用户信息表作为静态维表，统计结果表作为作业最终输出。表可以是临时的，并与单个 Flink sessio

overfit同步小助手 2024-09-10 14:03:54 0 收藏

23篇大数据系列（二）scala基础知识全集（史上最全，建议收藏）

最近几十年，高速发展的互联网，渗透进了我们生活的方方面面，整个人类社会都已经被互联网连接为一体。身处互联网之中，我们无时无刻不在产生大量数据，如浏览商品的记录、成交订单记录、观看视频的数据、浏览过的网页、搜索过的关键词、点击过的广告、朋友圈的自拍和状态等。这些数据，既是我们行为留下的痕迹，同时也是描

overfit同步小助手 2024-09-10 14:03:48 0 收藏

基于大数据的网络舆情分析系统的设计与实现

网络舆情作为衡量公众情绪和社会动态的风向标，其快速准确分析对于政府决策、企业声誉管理等具有重大意义。面对海量、快速更迭的数据，传统的手工分析方式显得力不从心，亟需技术革新。先利用Python强大的数据处理能力，结合网络爬虫技术，从各大社交平台、新闻网站等源头抓取数据。接着，通过`Scikit-lea

overfit同步小助手 2024-09-10 12:03:48 0 收藏

毕设开源基于Kmeans的图像分割算法软件设计

今天学长向大家分享一个毕业设计项目毕业设计基于Kmeans的图像分割算法软件设计毕业设计基于kmean的图像分割🧿 项目分享:见文末!项目运行效果：🧿 项目分享:见文末!

overfit同步小助手 2024-09-10 09:07:37 0 收藏

【大数据】分布式计算框架算法

分布式计算框架算法是为了解决大规模数据处理问题而设计的一系列算法。这些算法能够在多台计算机上分布执行计算任务，通过网络连接协同工作，从而提高数据处理速度和效率。常见的分布式计算框架包括Hadoop、Spark等。

overfit同步小助手 2024-09-10 08:04:07 0 收藏

B端：MES系统难度值超大，一文告诉你如何设计。

MES系统是一套面向制造企业车间执行层的生产信息化管理系统。它具有制造数据管理、计划排程管理、生产调度管理、库存管理、质量管理、人力资源管理、工作中心/设备管理、工具工装管理、采购管理、成本管理、项目看板管理、生产过程控制、底层数据集成分析、上层数据集成分解等管理模块，旨在为企业打造一个扎实、可靠、

overfit同步小助手 2024-09-10 07:03:56 0 收藏

Hadoop-HDFS三种模式介绍及配置

1、start-dfs.sh 在第一台启动，不意味着只使用了第一台，而是启动了集群。stop-dfs.sh 其实是关闭了集群 2、一台服务器关闭后再启动，上面的服务是需要重新启动的。这个时候可以先停止集群，再启动即可。也可以使用单独的命令，启动某一个服务。3、namenode 格式化有啥用?相当于在

overfit同步小助手 2024-09-10 07:03:31 0 收藏

为什么要做智慧水务信息化平台建设？带来的好处

是以物联感知技术、大数据、智能控制、云计算、人工智能、数字孪生、AI算法、虚拟现实技术为核心，以监测仪表、通讯网络、数据库系统、数据中台、模型软件、前台展示、智慧运维等产品体系为支撑，以城市水资源、水生态、水环境和水安全提升和建造智能化为目标的智慧水务体系。经过多年的探索与实践，深挖客户需求，形成的

overfit同步小助手 2024-09-10 05:01:15 0 收藏

前端必知之：前端模块化的CommonJS规范和ES Module规范详解

在当前目录下的 node_modules 目录查找。向上级目录逐级查找，直至根目录。查找 package.json 中的 main 属性指定的入口文件。默认文件名查找（index.js、index.json、index.node）。以下是一个简单的自定义模块查找流程示意图：在这个示例中，如果要加载模

overfit同步小助手 2024-09-10 04:02:43 0 收藏

水源地（水库）水质、水位、流量监测系统

随着全球气候变化和工业化进程的加速，水库作为重要的水资源储备和调节设施，其水质、水位和流量的监测与管理显得尤为重要。水库水质、水位、流量综合监测系统正是在这样的背景下应运而生，旨在实现对水库水资源的全面、实时、准确的监测与管理。- 水质监测：选择能够检测多项水质指标的传感器，如溶解氧传感器、浊度传感

overfit同步小助手 2024-09-10 03:03:54 0 收藏

Presto安装配置

和coordinator保持一样，不需要修改。上传客户端到Presto安装包。上传解压Presto安装包。集群规划（一主两从集群）hadoop02配置修改。注意，每台机器都需要启动。scp安装包到其他节点。hadoop01配置。

overfit同步小助手 2024-09-09 22:03:45 0 收藏

大数据-121 - Flink Time Watermark 详解附带示例详解

Watermark 是一个特殊的标志，它用于告诉 Flink 数据流中事件的进展情况。简单来说，Watermark 是 Flink 中估计的“当前时间”，表示所有早于该时间戳的事件都已经到达。Flink 认为当前时间在 Watermark 时间戳之前的所有事件已经接收完毕，不再期待有早于该时间戳的事

overfit同步小助手 2024-09-09 16:03:37 0 收藏

2024年GPU/AI算力租用价格是多少？

随着人工智能技术的飞速发展，GPU/AI算力的需求呈现出爆炸式增长。算力作为AI时代的基础设施，其重要性不言而喻。GPU/AI算力租用服务应运而生，为中小企业、科研机构及个人开发者提供了灵活、高效、低成本的计算资源解决方案。本文将深入探讨AI算力租用价格、性价比分析，以及该行业的趋势、机遇与挑战。

overfit同步小助手 2024-09-09 16:01:28 0 收藏

大数据-124 - Flink State 01篇状态原理和原理剖析：状态类型执行分析

同时在Flink中KeyedState和OperatorState均具有两种形式，其中一种为托管状态（Managed State）形式，由FlinkRuntime中控制和管理状态数据，并将状态数据转换为内存HashTables或RocksDB的对象存储，然后将这些状态数据通过内部的接口持久话到Che

overfit同步小助手 2024-09-09 08:03:40 0 收藏

A股有个股期权吗？

‌值得注意的是，‌个股期权采用“美式行权”方式，‌即投资者可以在到期前的任何交易日选择行权，‌但实际行权将在申请后的下一个交易日生效(T+1)。目前A股是没有在场内交易的个股期权，一般说的股票期权都是指ETF期权，在沪深交易所交易，不同于股指期权，在中金所交易，ETF期权到期是可以进行实物交割行权的

overfit同步小助手 2024-09-09 07:03:54 0 收藏

Windows系统下的Spark环境配置

在 Windows 系统上配置 Spark 环境涉及到几个步骤，包括安装 Java、下载和解压 Spark、配置环境变量以及验证安装。

overfit同步小助手 2024-09-09 04:03:44 0 收藏

掌握Flink键控状态（Keyed State）：深入指南与实践

在Flink中，键控状态是与特定键相关联的状态，每个键可以有自己的状态副本。键控状态对于需要对每个分组键分别进行计算的场景非常有用，例如，计算每个用户的点击总数。

overfit同步小助手 2024-09-09 02:03:54 0 收藏