大数据 - overfit.cn

kafka开启kerberos

配置zookeeper的kerberos验证，切换到配置文件目录下cd conf，添加zoo.cfg配置文件，cp zoo_sample.cfg zoo.cfg打开zoo.cfg配置文件，添加配置，修改Zookeeper的配置文件cat zoo.cfg 启用SASL认证，并指定认证提供者。在Zook

overfit同步小助手 2024-10-20 08:03:33 0 收藏

大数据新视界 --大数据大厂之 Dask：分布式大数据计算的黑马

本文深入介绍 Dask 在大数据处理中的应用。涵盖核心概念如数据处理工厂比喻，分布式计算架构，优势包括高效性与可扩展性、与其他工具集成性，丰富案例展示金融与科学计算等领域，性能优化策略及挑战应对，还探讨了与前沿技术结合及持续发展，文末有互动提问。

overfit同步小助手 2024-10-20 08:03:24 0 收藏

RabbitMQ-高级

3.1.2或者也可以直接引入MQ，解耦调用过程。

overfit同步小助手 2024-10-20 07:03:45 0 收藏

RabbitMQ--死信队列

以上的内容就是说明死信队列是为了解决死信的问题，什么是死信呢：就是消息在发送之后可能因为种种原因没有被消费的消息就变成了死信。我们为了不将死信直接删除，就设置了死信队列。1.消息被消费者拒绝2.发送的消息带有时间，时间到了还是没有被消费3.队列有生存时间，队列生存时间到了，它里面未来得及被消费的消息

overfit同步小助手 2024-10-20 07:03:34 0 收藏

计算机专业毕设选题推荐-基于大数据的货运物流数据可视化分析【python/大数据/深度学习/机器学习定制】

近年来，随着电子商务和物流行业的快速发展，货运物流数据呈现出爆炸式增长。传统的物流数据管理和分析方法已无法高效处理如此庞大的数据量，导致数据冗余、信息滞后等问题。这些问题不仅限制了物流企业的运营效率，也在一定程度上影响了整体的决策过程。因此，如何利用大数据技术对海量货运物流数据进行高效处理和分析，成

overfit同步小助手 2024-10-20 06:03:36 0 收藏

基于Java的大数据的餐饮销售场景分析

该系统能够实时采集并整合餐饮销售数据，进行深入的数据分析和挖掘，为用户提供直观的可视化展示和智能化推荐服务。数据库设计是本项目中的关键环节，需要充分考虑数据的结构、存储和查询效率。数据分析与挖掘：利用Java编写的大数据分析算法，对存储层中的数据进行深入分析和挖掘，提取有价值的信息并存储到推荐规则表

overfit同步小助手 2024-10-20 05:05:04 0 收藏

环境搭建--Hadoop完全分布式

Hadoop的完全分布式安装

overfit同步小助手 2024-10-20 05:04:32 0 收藏

OJ在线评测系统微服务用分布式消息队列 RabbitMQ 解耦判题服务和题目服务手搓交换机和队列实现项目异步化

分布式消息队列是一种用于异步通信的系统，它允许不同的应用程序或服务之间传递消息。消息队列的核心理念是将消息存储在一个队列中，发送方可以将消息发送到队列，而接收方则可以在适当的时候从队列中读取消息。这种机制有助于解耦应用程序，提高系统的可扩展性和可靠性。：发送方和接收方可以在不同的时间工作，不必直接交

overfit同步小助手 2024-10-20 04:03:18 0 收藏

hadoop全分布式搭建（三台虚拟机，一个主节点，两个从节点）

出现的信息即为压缩包所在地址，如果没有出现可能在桌面/home目录下，或者上传不成功。在windowns系统的浏览器中输入hadoop101的IP:9870，可以看到文件管理。在windowns系统的浏览器中输入hadoop102的IP:8088，可以看到资源管理。进入/opt/module/had

overfit同步小助手 2024-10-20 04:03:15 0 收藏

基于大数据的亚健康人群数据可视化设计和实现

随着B/S结构的不断发展，使用的人也不断增加，从而带动了AJAX技术的发展，和B/S结构一样，它也能在客户端上处理程序，这便缓解了服务器的负担，提高了交互性，而且实现了局部实时刷新。另外在原本的Spring中由于随着项目的扩大导入的jar包数量越来越大，随之出现了jar包版本之间的兼容性问题，而此时

overfit同步小助手 2024-10-20 03:03:48 0 收藏

大数据生态组件学习笔记（一）

负责开发和维护多个知名的开源项目，如 Apache HTTP Server、Apache Hadoop、Apache Spark 等。spark是在内存中计算，然后数据存在内存中吗，从内存中读取数据？，实际需求可能会更高，考虑到中间结果、操作的复杂性和其他因素，建议至少准备 1.5 到 2 倍的内存

overfit同步小助手 2024-10-20 03:03:42 0 收藏

Spark Streaming 原理与代码实例讲解

Spark Streaming 原理与代码实例讲解作者：禅与计算机程序设计艺术 / Zen and the Art of Computer Programming1. 背景介绍1.1 问题的由来随着互联网

overfit同步小助手 2024-10-20 03:03:29 0 收藏

spring boot整合rabbitmq

通过以上步骤，你可以在Spring Boot应用中整合RabbitMQ，实现消息的发送和接收。这只是一个基础的示例，实际应用中可能需要更复杂的配置和错误处理机制。

overfit同步小助手 2024-10-20 01:03:39 0 收藏

StarRock3.3 安装部署（存算分离、存算一体保姆式教程）

服务器前置要求：1、内存>=32GBwget。

overfit同步小助手 2024-10-20 00:03:47 0 收藏

Python大数据学习之Hadoop学习——day08_hive函数

注意：cluster by 和 distribute by 字段名 sort by 字段名受当前设置的reduces数量影响，但是设置的reduce数量对order by 无影响，因为order by 就是全局排序，就是一个reduce。分组查询格式：select 分组字段名，聚合函数(字段名)

overfit同步小助手 2024-10-20 00:03:22 0 收藏

RabbitMQ、RacketMQ、Kafka有哪些区别

RabbitMQ、RocketMQ和Kafka都是流行的消息队列系统，但它们在多个方面存在区别：一、消息传递语义二、性能和吞吐量三、数据存储和持久化四、适用场景

overfit同步小助手 2024-10-20 00:03:19 0 收藏

Kafka 原理与代码实例讲解

Kafka 原理与代码实例讲解作者：禅与计算机程序设计艺术 / Zen and the Art of Computer Programming1. 背景介绍1.1 问题的由来随着大数据时代的到来，分布式系统逐渐成为处理海量数

overfit同步小助手 2024-10-19 23:04:07 0 收藏

BigData技术集成：股票筛选器演示应用程序

本文还有配套的精品资源，点击获取简介：本项目演示了如何利用Docker-Composer、Spark、Cassandra、Parquet和SnackFS等BigData技术处理金融数据，特别是在股票市场中的应用。通过使用Docker Compose管理多容器应用，Apache Spark的高效

overfit同步小助手 2024-10-19 23:03:59 0 收藏

RabbitMQ Server 3.0.4安装与配置指南

本文还有配套的精品资源，点击获取简介：RabbitMQ是一个基于AMQP协议的开源消息代理和队列服务器，用于分布式系统中的异步任务处理和消息传递。本文档提供了一个在Linux环境下安装和配置RabbitMQ Server 3.0.4版本的详细指南。从环境准备到安全措施，本文指导用户完成安装全过

overfit同步小助手 2024-10-19 23:03:55 0 收藏

springboot+大数据+数据挖掘+基于数据挖掘技术的线上招聘信息分析系统【内含源码+文档+部署教程

基于数据挖掘技术的线上招聘信息分析系统旨在通过应用先进的数据分析方法，为求职者和招聘者提供更加高效、精准的招聘服务。总体而言，该系统通过数据挖掘技术的应用，为招聘市场带来了更加智能化和个性化的服务体验。管理员进行爬取数据后可以在看板页面查看到公司名称、招聘信息、招聘信息总数、职位、学历、行业、公司规

overfit同步小助手 2024-10-19 23:03:38 0 收藏