大数据 - overfit.cn

Filebeat、Logstash和Fluentbit -- Kafka

Filebeat、Logstash和Fluentbit是三种常见的日志采集工具，它们都可以与Kafka进行集成，以实现日志数据的高效传输和处理。

overfit同步小助手 2024-09-27 12:03:48 0 收藏

StarRocks Connector for Apache Flink 使用教程

StarRocks Connector for Apache Flink 使用教程 starrocks-connector-for-apache-flink项目地址:https://gitcode.com/gh_mirrors/st/starrocks-connector-for-apache-fl

overfit同步小助手 2024-09-27 12:03:23 0 收藏

【AI大数据计算原理与代码实例讲解】图计算引擎

【AI大数据计算原理与代码实例讲解】图计算引擎关键词：图数据库图算法分布式计算Apache GiraphNeo4jAmazon NeptuneP

overfit同步小助手 2024-09-27 11:04:13 0 收藏

开源的 Kafka 管理平台

对数据使用现成的 Serde。

overfit同步小助手 2024-09-27 11:04:09 0 收藏

InfluxData 的 rskafka 开源项目指南

InfluxData 的 rskafka 开源项目指南 rskafkaA minimal Rust client for Apache Kafka项目地址:https://gitcode.com/gh_mirrors/rs/rskafka 项目介绍rskafka 是由 InfluxData 维护的一

overfit同步小助手 2024-09-27 10:03:33 0 收藏

介绍 Apache Spark 的基本概念和在大数据分析中的应用。

弹性分布式数据集（Resilient Distributed Dataset，RDD）：RDD 是 Spark 中的核心数据抽象，它是一个可并行计算的、可容错的、可读写的分布式数据集。Spark Core：Spark Core 是 Spark 的基础模块，提供了 RDD 的构建和操作功能，以及与底层

overfit同步小助手 2024-09-27 09:03:52 0 收藏

Hadoop原理与代码实例讲解

Hadoop原理与代码实例讲解作者：禅与计算机程序设计艺术 / Zen and the Art of Computer Programming1. 背景介绍1.1 问题的由来随着互联网和大数据时代的到来，数据量呈爆炸式增长。

overfit同步小助手 2024-09-27 09:03:23 0 收藏

大数据新视界 --大数据大厂之HBase 在大数据存储中的应用与表结构设计

本文深入探讨 HBase 在大数据存储中的应用与表结构设计。涵盖其核心概念、与其他技术比较、应用策略、项目案例、挑战及解决方案、发展趋势与新兴技术结合等内容。通过代码示例与实际案例，阐述 HBase 的高可靠性、高性能与可扩展性，为大数据存储提供全面指南。

overfit同步小助手 2024-09-27 09:03:11 0 收藏

消息中间件---Kafka

Kafka是一个分布式流处理平台,类似于消息队列或企业消息传递系统；

overfit同步小助手 2024-09-27 08:03:51 0 收藏

大数据-147 Apache Kudu 常用 Java API 增删改查

Java API，开发者可以创建和管理 Kudu 表，定义表的模式（Schema），以及执行 CRUD 操作。API 支持批量插入，以提高性能，并提供异步调用功能，允许更高效的并发处理。此外，Kudu API 支持使用行键进行快速随机读取和写入，适合实时数据处理场景。通过 Java API，用户可以

overfit同步小助手 2024-09-27 08:03:30 0 收藏

Spark LLAP库安装与使用指南

Spark LLAP库安装与使用指南 spark-llap项目地址:https://gitcode.com/gh_mirrors/sp/spark-llap 一、项目目录结构及介绍Apache Spark社区中的spark-llap项目位于https://github.com/hortonworks

overfit同步小助手 2024-09-27 07:03:55 0 收藏

Spark Jobs REST Client 使用教程

Spark Jobs REST Client 使用教程 spark-jobs-rest-client Fluent client for interacting with Spark Standalone Mode's Rest A

overfit同步小助手 2024-09-27 07:03:51 0 收藏

从数据仓库到数据飞轮：数据技术演进的探索与思考

在当今的数字化浪潮中，数据被视为一种极具价值的资源，类似于传统工业时代的石油，它为企业挖掘出深邃的洞察力，并成为决策过程中不可或缺的基石。随着技术的不断演进，数据管理的策略与架构也经历了显著的变革，从早期的数据仓库模式，逐步迈向集成化的数据中台架构，并朝着更加动态灵活的数据飞轮体系迈进。

overfit同步小助手 2024-09-27 07:03:43 0 收藏

【RabbitMQ】消息分发、事务

对消息分发以及事务进行了概述

overfit同步小助手 2024-09-27 07:03:32 0 收藏

细说Flink状态管理

KeyedState 顾名思义就是某个key对应的某些状态的值，因为我们在进行keyBy的时候，我们是需要知道这个对应的key的value值有哪些，也需要知道这个value值有多少等，所以这个KeyedState 一般分为ValueState，ListState, MapState等，分别存储这些k

overfit同步小助手 2024-09-27 04:03:54 0 收藏

使用 RabbitMQ 实现秒杀订单系统的异步消息处理

秒杀订单的主交换机和队列：用于处理异步下单请求。成功和失败的订单队列：分别处理订单处理成功和失败的消息。死信队列（Dead Letter Queue）：处理超时或者其他异常导致的消息失败。我们使用了来根据路由键将消息发送到不同的队列。每个订单请求在被处理时，首先会进入秒杀队列，然后根据处理结果被转发

overfit同步小助手 2024-09-27 04:03:44 0 收藏

Spring Boot 中整合 Kafka

通过以上步骤，我们成功地在 Spring Boot 中整合了 Kafka，并实现了消息的生产和消费。Spring Kafka 提供了简单易用的 API，使得我们可以轻松地与 Kafka 进行交互。你可以根据实际需求进一步扩展和优化这个示例。在 Kafka 中，消费者消费消息失败后是否重新入队（重回队

overfit同步小助手 2024-09-27 04:03:39 0 收藏

PySpark单机模式（local）的环境搭建

本文介绍如何在Windows操作系统（以win11为例）上配置一个可以运行PySpark程序的开发环境

overfit同步小助手 2024-09-27 04:03:24 0 收藏

MQ入门（一）：同步调用和异步调用--RabbitMQ基础入门

MQ入门知识，异步调用和同步调用的对比，Rabbit的基础使用

overfit同步小助手 2024-09-27 03:03:31 0 收藏

Spark3 入门指南（三）

Spark 应用程序调优和优化是一个广泛的话题。本章介绍了常见的与性能相关的挑战，包括内存问题和长时间运行的查询性能。优化 Spark 应用程序的能力需要对一些调谐旋钮、Spark 如何管理其内存以及利用 AQE 的一些新功能有广泛的理解。Spark 中的调谐旋钮是属性，有三种不同的设置方式。第一种

overfit同步小助手 2024-09-27 03:03:23 0 收藏