大数据 - overfit.cn

RabbitMQ交换机与队列

当这样做的时候，我们需要明白一点，在AMQP 0-9-1中，消息的负载均衡是发生在消费者（consumer）之间的，而不是队列（queue）之间。延时队列,队列内部是有序的，最重要的特性就体现在它的延时属性上，延时队列中的元素是希望在指定时间到了以后或之前取出和处理，简单来说，延时队列就是用来存放需

overfit同步小助手 2024-03-08 04:03:38 0 收藏

【大数据毕设选题】大数据B站数据分析与可视化 - python 数据分析大数据

🔥 这两年开始毕业设计和毕业答辩的要求和难度不断提升，传统的毕设题目缺少创新和亮点，往往达不到毕业答辩的要求，这两年不断有学弟学妹告诉学长自己做的项目系统达不到老师的要求。为了大家能够顺利以及最少的精力通过毕设，学长分享优质毕业设计项目，今天要分享的是🚩大数据B站数据分析与可视化🥇学长这里给一

overfit同步小助手 2024-03-08 03:03:41 0 收藏

flink知识点

flink常考知识点汇总

overfit同步小助手 2024-03-08 03:03:36 0 收藏

银行数据仓库体系实践（18）--数据应用之信用风险建模

银行的经营风险的机构，那在第15节也提到了巴塞尔新资本协议对于银行风险的计量和监管要求，其中信用风险是银行经营的主要风险之一，它的管理好坏直接影响到银行的经营利润和稳定经营。信用风险是指交易对手未能履行约定契约中的义务而给银行造成经济损失的风险。典型的表现形式包括借款人发生违约或信用等级下降。借款人

overfit同步小助手 2024-03-08 02:03:53 0 收藏

Flink实时大数据处理性能测试

1.背景介绍Flink是一个开源的流处理框架，用于实时大数据处理。它可以处理大量数据，提供低延迟和高吞吐量。Flink的性能测试是一项重要的任务，可以帮助我们了解其在实际应用中的表现。在本文中，我们将讨论Flink实时大数据处理性能测试的背景、核心概念、算法原理、代码实例、未来发展趋势和挑战。1.1

overfit同步小助手 2024-03-08 02:03:41 0 收藏

RabbitMQ 学习笔记

推模式下，生产者发布消息到队列时，会立即将这条消息发送给所有订阅该队列的消费者，优点：实现实时通信，缺点：如果消费者的处理能力跟不上生产者的速度，就会在消费者处造成消息堆积，因此需要根据消费能力做流控（比如 RabbitMQ 用 QOS 来限制），RabbitMQ 默认使用推消息。拉模式下，生产者发

overfit同步小助手 2024-03-08 01:03:36 0 收藏

Zookeeper的安全认证与加密

1.背景介绍Zookeeper是一个开源的分布式协调服务，用于构建分布式应用程序的基础设施。它提供了一种可靠的、高性能的、分布式的协调服务，以实现分布式应用程序的一致性。Zookeeper的安全认证和加密是确保分布式应用程序的安全性和数据完整性的关键部分。在本文中，我们将讨论Zookeeper的安全

overfit同步小助手 2024-03-08 01:03:28 0 收藏

消息队列-RabbitMQ

消息队列的认识与使用

overfit同步小助手 2024-03-08 00:03:51 0 收藏

实时Flink的数据库与Kafka集成优化案例

1.背景介绍在现代数据处理系统中，实时数据处理和分析是至关重要的。Apache Flink是一个流处理框架，可以用于实时数据处理和分析。在许多场景下，Flink需要与数据库和Kafka等消息系统进行集成，以实现更高效的数据处理。本文将讨论Flink与数据库和Kafka集成的优化案例，并提供实际示例和

overfit同步小助手 2024-03-08 00:03:42 0 收藏

C# 使用 RabbitMQ 的详细使用方法

RabbitMQ 是一个功能强大的消息队列系统，可用于在分布式系统中进行可靠的消息传递。本篇博客将详细介绍如何在 C# 中使用 RabbitMQ 实现各种消息队列操作，包括连接 RabbitMQ 服务器、创建通道、声明队列、发布消息以及消费消息等。RabbitMQ 是一个开源的消息代理软件，实现了

overfit同步小助手 2024-03-07 21:03:31 0 收藏

spark从表中采样（随机选取）一定数量的行

Spark会对表的每个分区进行采样，并根据采样结果计算总体的采样比例，然后从每个分区中选择相应比例的数据。使用一种伪随机函数或随机算法来选择采样的数据。然后，根据指定的采样比例或行数，从随机数序列中选择相应数量的随机数，并返回与这些随机数关联的行。通过使用随机算法和利用分布和分区信息来提供高效的随机

overfit同步小助手 2024-03-07 18:03:52 0 收藏

2024.1.30 Spark SQL的高级用法

N preceding : 表示往前的N行, N的取值可以是具体的数据, 也可以是关键词(unbounded(边界))lead(字段, 往后第N行, 默认值): 可以实现将对应的字段的后N行的值和当前行放置到同一行中, 如果没有, 设置为默认值。lag(字段, 往前第N行, 默认值): 可以实现将对

overfit同步小助手 2024-03-07 18:03:45 0 收藏

数据仓库技术与应用

数据仓库是一种面向商务智能 (BI) 活动（尤其是分析）的数据管理系统，它仅适用于查询和分析，通常涉及大量的历史数据。在实际应用中，数据仓库中的数据一般来自应用日志文件和事务应用等广泛来源。数据仓库能够集中、整合多个来源的大量数据，借助数据仓库的分析功能，企业可从数据中获得宝贵的业务洞察，改善决策。

overfit同步小助手 2024-03-07 18:03:34 0 收藏

【Zookeeper】what is Zookeeper?

即使正确实现了这些服务，当应用程序部署时，这些服务的不同实现也会导致管理上的复杂性。由于实现这些服务的难度很大，应用程序通常会在这方面偷工减料，这使得它们在发生变更。每次实现这些服务时，都需要做大量的工作来修复不可避免的错误和竞态条件。所有这些类型的服务都以某种形式被分布式应用程序所使用。Zooke

overfit同步小助手 2024-03-07 17:03:47 0 收藏

Ubuntu22.04下在Spark2.4.0中采用Local模式配置并启动pyspark

Ubuntu22.04下在Spark2.4.0中采用Local模式配置并启动pyspark（python3.5.2）

overfit同步小助手 2024-03-07 15:03:56 0 收藏

kafka学习笔记

Kafka是最初由Linkedin公司开发，是一个分布式、支持分区的（partition）、多副本（replica），基于zookeeper协调的分布式消息系统，它的最大的特性就是可以实时的处理大量数据以满足各种需求场景：比如基于hadoop的批处理系统、低延迟的实时系统、Storm/Spark流式

overfit同步小助手 2024-03-07 13:03:48 0 收藏

Spring Cloud Netflix Eureka的参数调优

下面主要分为Client端和Server端两大类进行简述，Eureka的几个核心参数。

overfit同步小助手 2024-03-07 13:03:19 0 收藏

阿里面试：设计一个大并发、大数据的系统架构，说说设计思路

以上的内容，如果大家能对答如流，如数家珍，基本上面试官会被你震惊到、吸引到。最终，让面试官爱到 “不能自已、口水直流”。offer，也就来了。在面试之前，建议大家系统化的刷一波 5000页《尼恩Java面试宝典PDF》，里边有大量的大厂真题、面试难题、架构难题。很多小伙伴刷完后，吊打面试官，

overfit同步小助手 2024-03-07 12:03:51 0 收藏

计算机毕业设计基于大数据的智能家居销量数据分析系统的设计与实现 Java实战项目附源码+文档+视频讲解

随着科技的不断发展，智能家居系统已经成为了人们生活中不可或缺的一部分。而随着智能家居销量的不断增加，如何对这些数据进行有效的分析和利用也成为了当前亟待解决的问题。因此，本文提出了一种基于大数据的智能家居销量数据分析系统的设计与实现。该系统主要分为前台和后台两个部分，用户可以通过前台进行注册登录、查看

overfit同步小助手 2024-03-07 12:03:33 0 收藏

【Java】SpringBoot快速整合Kafka

Kafka是一个开源的流式平台，用于构建实时数据流应用程序和实时数据管道。Kafka旨在处理大规模的数据流，具有高吞吐量、可扩展性、持久性和容错性的特点。

overfit同步小助手 2024-03-07 12:03:24 0 收藏