大数据 - overfit.cn

Flink 实时数仓（九）【DWS 层搭建（三）交易域汇总表创建】

Flink 实时数仓，DWS 层搭建，旁路缓存、异步IO读取维表来查询优化

overfit同步小助手 2024-08-12 13:03:28 0 收藏

HBase RowKey设计原理与代码实例讲解

HBase RowKey设计原理与代码实例讲解作者：禅与计算机程序设计艺术 / Zen and the Art of Computer Programming1. 背景介绍1.1 问题的由来HBase 是一个

overfit同步小助手 2024-08-12 12:03:44 0 收藏

Elasticsearch与Kafka集成：实现数据流处理

Elasticsearch是一个基于Lucene的搜索和分析引擎，它提供了一个分布式、多租户能力的全文搜索引擎，具有HTTP Web界面和无模式JSON文档。Elasticsearch以其可扩展性、易用性和对海量数据的处理能力而闻名，是许多大型企业和项目的首选数据存储和搜索解决方案。Apache K

overfit同步小助手 2024-08-12 11:03:38 0 收藏

dolphinScheduler跑spark任务调度问题汇总

分发spark安装包到各个节点，因为ds的worker涉及到hadoop11-13，都需要有spark-submit提交作业的能力。如果在windows压缩，可能有问题。推荐在linux上压缩。在服务器上运行，需要将他们放到HDFS上。：python3找不到。

overfit同步小助手 2024-08-12 10:03:12 0 收藏

Oracle数据库 v$archived_log

V$ARCHIVED_LOG视图描述了系统中已经归档的日志文件的相关信息。归档日志是ARCHIVELOG模式的一种，用来记录DML以及DDL对数据库中对象所做的更改，保护数据库以及实施重做数据库恢复。V$ARCHIVED_LOG视图的主要用途是查看已经归档的日志的信息，确定要恢复的日志。

overfit同步小助手 2024-08-12 08:03:30 0 收藏

netty如何结合Zookeeper如何高并发的代码实现步骤 —— 慧哥充电桩开源平台

总结起来，将Netty与Zookeeper结合应用于高并发系统，不仅需要理解各自的工作原理和技术特点，还需要结合实际需求设计和实现多种高可用、高可靠的架构方案。Netty是一个高性能、异步事件驱动的NIO（非阻塞IO）网络通信框架，而Zookeeper是一个分布式、开放源码的分布式应用程序协调服务，

overfit同步小助手 2024-08-12 07:03:38 0 收藏

什么是数据湖？一文详解数据湖与数据仓库的区别

本文主要探讨了什么是数据仓库和数据湖，辨析了数据仓库和数据湖的区别以及如何快速搭建数据仓库。

overfit同步小助手 2024-08-12 06:03:54 0 收藏

RabbitMQ高级篇（如何保证消息的可靠性、如何确保业务的幂等性、延迟消息的概念、延迟消息的应用）

overfit同步小助手 2024-08-12 06:03:35 0 收藏

tp（钱包数字）机器学习与 AI 大数据的融合：开启智能新时代!

通过以上的初级编程实践，我们对 Hadoop 的 MapReduce 模型有了初步的了解和实践经验。MapReduce 为大数据处理提供了一种简单而有效的编程模型，但在实际应用中，还需要根据具体的业务需求和数据特点进行优化和改进。Hadoop 作为一个开源的分布式系统架构，为大数据处理提供了强大的支

overfit同步小助手 2024-08-12 05:03:46 0 收藏

Clickhouse keeper方式搭建集群（不再依赖zookeeper）

clickhouse不依赖zk部署集群

overfit同步小助手 2024-08-12 04:03:52 0 收藏

从1到N：Hadoop MapReduce如何变身大数据处理超能英雄？

好啦，亲爱的朋友们，我们今天的探险之旅就到这里了。希望你们对Hadoop MapReduce的任务调度有了更深的理解。记住，实践出真知，赶紧动手试试吧！🚀。

overfit同步小助手 2024-08-12 04:03:38 0 收藏

大数据信用报告查询有什么作用?怎么选择查询平台?

然而，网络上的金融交易存在着一定的风险，为了有效地防范这些风险，金融机构采用了大数据技术进行风险控制，下面，小易大数据平台将详细介绍大数据信用报告查询有什么作用?市面上的大数据信用查询平台是比较多的，想要在众多的平台中选择一个比较好的平台很不容易，但不是没有。小易大数据平台就是一个，小易大数据是市面

overfit同步小助手 2024-08-12 03:03:11 0 收藏

django大数据背景下世界杯数据的可视化分析v4841l5r

随着大数据技术的迅猛发展，数据可视化在各个领域的应用日益广泛。本文以世界杯足球赛为研究对象，探讨了大数据背景下世界杯可视化分析的方法、意义及其在实际应用中的价值。通过对大量赛事数据的收集、整理和分析，结合可视化技术，本文深入剖析了世界杯赛事的各个方面，为球迷、媒体、教练和决策者提供了直观、深入的数据

overfit同步小助手 2024-08-12 02:03:56 0 收藏

【kafka运维】分区副本重分配、数据迁移、副本扩缩容 (附教学视频)

作为一名即将求职的程序员，面对一个可能跟近些年非常不同的 2019 年，你的就业机会和风口会出现在哪里？在这种新环境下，工作应该选择大厂还是小公司？已有几年工作经验的老兵，又应该如何保持和提升自身竞争力，转被动为主动？就目前大环境来看，跳槽成功的难度比往年高很多。一个明显的感受：今年的面试，无论一面

overfit同步小助手 2024-08-12 02:03:44 0 收藏

Flink Sql Redis Connector

以下为sql读取结果，直接将redis数据解析成我们需要的表格形式。

overfit同步小助手 2024-08-12 02:03:27 0 收藏

Apache Flink CDC 使用教程

Apache Flink CDC 使用教程 flink-cdcFlink CDC is a streaming data integration tool项目地址:https://gitcode.com/gh_mirrors/flin/flink-cdc 1. 项目介绍Apache Flink CD

overfit同步小助手 2024-08-12 01:03:53 0 收藏

RabbitMQ消息积压及处理方法

RabbitMQ中的消息积压是一个常见的问题，但可以通过优化消费者处理逻辑、增加消费者数量、调整队列配置、建立监控体系以及实施消息降级与限流等方法来有效处理。但在高并发、高流量的业务场景中，RabbitMQ中的消息可能会因为消费者处理不及时等原因，造成消息积压和堆积。消息降级与限流：在消息积压严重时

overfit同步小助手 2024-08-12 00:03:59 0 收藏

Spark SQL 学习手册（一）

原文：zh.annas-archive.org/md5/38E33AE602B4FA8FF02AE9F0398CDE84译者：飞龙协议：CC BY-NC-SA 4.0前言我们将从 Spark SQL 的基础知识和其在 Spark 应用中的作用开始。在对 Spark SQL 进行初步了解之后，我们将专

overfit同步小助手 2024-08-12 00:03:56 0 收藏

大模型与大数据

很多现象是人无法理解与分析的，所以在落地过程中，还是“穷举”，不仅是场景“穷举”，场景相关的现象也是“穷举”出来的，大大降低了价值与准确度。好吧，算力、算法都不是车厂应该投入的方向，那么就只有数据了，区别于上面说的那些“文档”类知识，数据是汽车在全生命周期中的所有记录，记录着汽车在运行中的每一分每一

overfit同步小助手 2024-08-12 00:03:38 0 收藏

大数据如何推动工业数字化发展？

大数据为企业提供了洞察市场趋势、消费者行为等关键信息的窗口，还为企业优化生产流程、提升产品质量以及推动创新提供了强有力的支持。大数据的广泛应用，正推动着工业数字化向更深层次发展，为企业创造更多的价值和竞争优势。

overfit同步小助手 2024-08-11 22:03:37 0 收藏