大数据 - overfit.cn

【大数据】Flink CDC 实时同步mysql数据

Flink CDC 实时同步mysql数据

overfit同步小助手 2024-10-08 08:03:39 0 收藏

六大EI学术会议横跨中国多地，覆盖计算、通信、量子技术、大数据、人工智能等前沿领域

六大EI学术会议将召开，覆盖计算、通信、量子技术、大数据、人工智能等前沿领域，横跨中国多地，为国内外学者提供跨地域跨学科交流平台，促进产学研融合，推动科技进步。

overfit同步小助手 2024-10-08 04:03:42 0 收藏

华为ICT大赛2023-2024全国总决赛-实践赛-云赛道实验试题-大数据部分个人解析

overfit同步小助手 2024-10-08 02:04:22 0 收藏

【性能优化】低配starRocks常驻内存优化

由于服务器的实际资源小于starRocks官方的配置，导致starRocks在无任务的情况下，常驻内存偏高，可用于查询的资源变小。实际部署的集群一般是4C8G和8C16G，be的配置不达标为了解决单次查询内存不足的问题，提升系统稳定性。放弃starRocks默认开启的通过内存换时间的优化逻辑，降低内

overfit同步小助手 2024-10-08 01:04:34 0 收藏

Hadoop之mapreduce -- WrodCount案例以及各种概念

mapreduce的介绍以及Java代码实现mapreduce的word count案例

overfit同步小助手 2024-10-08 00:03:56 0 收藏

尚硅谷大数据全套技术链接

链接：https://pan.baidu.com/s/1UWloFOsZHgMSzIvmx6n9MA。链接：https://pan.baidu.com/s/1pT5Pdnjy4hLiFX2Oov4BLQ。链接：https://pan.baidu.com/s/1SVt51kJjvFnNcMR30glO

overfit同步小助手 2024-10-08 00:03:27 0 收藏

大数据实时数仓Hologres（四）：基于Flink+Hologres搭建实时数仓

在Flink开发平台，新建名为DWD的SQL流作业，并将如下代码拷贝到SQL编辑器后，部署并启动作业。创建Catalog时可以设置默认的源表、维表和结果表的WITH参数，也可以设置创建Hologres物理表的默认属性，例如上方table_property开头的参数。a) 在Flink开发平台，新建名

overfit同步小助手 2024-10-07 18:03:54 0 收藏

Spark的介绍

DataBricks官网：https://databricks.com/spark/aboutspark的诞生其实是因为MR计算引擎太慢了。MR计算是基于磁盘的，Spark计算是基于内存的。spark的发展历程：2009年，Spark诞生于伯克利AMPLab，伯克利大学的研究性项目。2014年2月成

overfit同步小助手 2024-10-07 16:03:30 0 收藏

大数据毕业设计选题推荐-重庆旅游景点数据分析系统-Python-Hive-Hadoop-Spark

近年来，重庆作为中国西部地区的重要旅游目的地，其旅游业呈现出蓬勃发展的态势。根据重庆市文化和旅游发展委员会的数据，2022年重庆接待国内外游客3.19亿人次，同比增长35.6%；实现旅游总收入3,651.23亿元，同比增长41.2%。这一增长趋势在线上平台得到了充分反映，据某知名旅游网站统计，202

overfit同步小助手 2024-10-07 16:03:23 0 收藏

【Earth‘s Future】遥感大数据在水环境监测中的应用现状、挑战与未来展望

水动力学和水质估计是研究生态、环境和水文过程的基本但具有挑战性的问题。水提取和利用遥感大数据对水质参数进行定量估计，由于遥感大数据具有多尺度地球表面有效和连续监测的能力，为观测水动态和水质估算提供了有效的途径。在过去的几十年里，人们付出了相当大的努力来开发各种取水和定量估计不同类型水（包括海洋、湖泊

overfit同步小助手 2024-10-07 15:03:48 0 收藏

什么是大数据？

大数据到底是什么？大数据的定义是。这也被称为。简单来说，大数据是的数据集，尤其是来自新数据源的数据集。这些数据集非常庞大，传统数据处理软件根本无法管理它们。但这些海量数据可用于解决您以前无法解决的业务问题。

overfit同步小助手 2024-10-07 13:03:14 0 收藏

Defensor 4.5：构建数据资产为中心的安全运营体系

数据安全策略中心是数据安全防护的全局策略中心，支持多维度的访问控制策略，提供基于分类分级的访问策略，行列访问控制策略，防精准查询、阻断策略等，实现精细的敏感数据访问控制。最后，结合策略智能推荐系统，根据安全事件的类型和特点智能生成并下发推荐处置策略，如访问阻断、权限降级、访问频率限制、数据动态脱敏和

overfit同步小助手 2024-10-07 12:07:17 0 收藏

（四十一）大数据实战——spark的yarn模式生产环境部署

Spark 是一个开源的分布式计算系统。它提供了高效的数据处理能力，支持复杂的数据分析和处理任务，是一种基于内存的快速、通用、可扩展的大数据分析计算引擎。Spark Core：实现了Spark的基本功能，包含任务调度、内存管理、错误恢复、与存储系统交互等模块。Spark Core中还包含了对弹性分布

overfit同步小助手 2024-10-07 12:03:47 0 收藏

数据仓库系列14：数据清洗和转换的常见方法有哪些?

数据仓库的建立不仅仅是数据的简单存储，更是对数据的深度利用。而数据清洗和转换是确保数据质量和一致性的重要环节。在这篇文章中，我们将深入探讨数据清洗和转换的常见方法，帮助你在数据仓库中更高效地处理数据。

overfit同步小助手 2024-10-07 09:03:28 0 收藏

【大数据】基础认知入门

唉，最近有点迷茫，本着迷茫就多看书、多学习的原则，于是就来学学【大数据】。说起【大数据】这玩意，我有点对自己感到无语。此话怎讲呢？且听我说。此前，我一直在思考一个问题，那就是【我能用大数据给我公司做什么】。对啊，能做什么，这是个问题。但更大的问题是：我是一个大数据外行，只曾听闻过大数据3个字，却我从

overfit同步小助手 2024-10-07 08:03:48 0 收藏

【Flink】详解 Flink 中的 Watermark

在流处理系统中，处理无序数据是一大挑战，尤其是当数据到达的时间不一致时。Flink 提供了 Watermark 机制来解决这一问题，帮助系统在处理迟到数据时做出智能决策。本篇文章将通过生动的案例，详细讲解 Flink 中的 Watermark 概念及其作用，探讨如何高效使用 Watermark，并提

overfit同步小助手 2024-10-07 00:03:51 0 收藏

开放系统，面向各类业务需求可提供定制化服务的智慧物流开源了

智慧物流视频监控平台是一款功能强大且简单易用的实时算法视频监控系统。它的愿景是最底层打通各大芯片厂商相互间的壁垒，省去繁琐重复的适配流程，实现芯片、算法、应用的全流程组合，从而大大减少企业级应用约95%的开发成本。构建基于Ai技术的安全监管平台，可逐步实现智能化巡检，针对安全事故隐患进行有效监控预警

overfit同步小助手 2024-10-06 22:04:12 0 收藏

一文搞懂FLink WaterMark源码

上述代码的大致实现是，当上游一个task将watermark广播到下游的所有channel（可以理解成下游所有task）之后，下游的task会更新对上游inputChannel记录状态信息中的watermark值，下游每个task都记录这上游所有task的状态值。然后下游task再从所有上游inpu

overfit同步小助手 2024-10-06 20:03:18 0 收藏

12、Flink 解决流上的确定性最佳实践

Flink 解决流上的确定性最佳实践

overfit同步小助手 2024-10-06 19:03:52 0 收藏

史上牛刊！IF10.2，中科院1区TOP，1天见刊！无版面费，国人审稿绝对优势

运用电网、电池、压力计算机模型等解决能源系统的技术问题研究。年发文量在800篇左右，发文量稳定上升，无暴涨趋势。• 期刊分区：JCR2/3/4区，中科院4区。• 最新JCR分区为Q1，SCIE检索；• 中科院大类分区：工程技术1区。• 能源科学类，1.5-2.0。• 影响因子：1.5-2.0。• 期

overfit同步小助手 2024-10-06 17:03:32 0 收藏