大数据 - overfit.cn

【RabbitMQ高级特性】消息可靠性原理

介绍了RabbitMQ如何保证消息可靠传输特性，包括消息确认机制、持久性机制、发送者确认机制

overfit同步小助手 2024-10-13 03:03:18 0 收藏

SPARKNaCl：基于SPARK 2014的TweetNaCl密码库重实现教程

SPARKNaCl：基于SPARK 2014的TweetNaCl密码库重实现教程 SPARKNaCl SPARK 2014 re-implementation of the TweetNaCl crypto library

overfit同步小助手 2024-10-13 02:03:42 0 收藏

hbase之布隆过滤器

在HBase中，布隆过滤器用于减少查询时间，通过减少不必要的块加载提高集群吞吐率。布隆过滤器就是这样一个高度节省空间的结构，并且其时间也远超一般算法，但是布隆过滤器存在一定的失误率，例如在网页URL黑名单过滤中，布隆过滤器绝不会将黑名单中网页查错，但是有可能将正常的网页URL判定为黑名单当中的，它的

overfit同步小助手 2024-10-13 01:04:51 0 收藏

【ACM出版】2024年第四届人工智能与大数据国际学术研讨会 (AIBDF 2024)

overfit同步小助手 2024-10-13 01:04:01 0 收藏

Flink 水位线(Watermark)个人总结

在Flink中，用于衡量事件时间进展的标记，被称为水位线。可以看作一条特殊的数据记录，它是插入到数据流中的一个标记点。主要内容就是一个时间戳，用来指示当前的事件时间自身理解：本质上就是一个时间戳，表示比这个时间早的事件已经全部到达。并且在数据乱序的情况下，通过水位线可以判断出迟到的数据。

overfit同步小助手 2024-10-13 00:03:37 0 收藏

Kafka和RabbitMQ比较

RabbitMQ：RabbitMQ也提供了良好的性能，但它更侧重于消息的可靠性和灵活性。然而，在高并发和高吞吐量的场景下，RabbitMQ的性能可能不如Kafka。RabbitMQ的设计目标是提供一个可靠的、易于使用的消息传递系统，它支持多种消息传递模式，如发布/订阅、路由、工作队列等。Rabbit

overfit同步小助手 2024-10-13 00:03:32 0 收藏

【AI大数据计算原理与代码实例讲解】ElasticSearch

【AI大数据计算原理与代码实例讲解】ElasticSearch关键词：大数据、分布式、实时搜索、全文检索、数据索引、数据存储、机器学习、REST API、查询优化、高可用性、弹性扩展1. 背景介绍1.1 问题的

overfit同步小助手 2024-10-13 00:03:13 0 收藏

【Hive】Hive 常见连接方式介绍

hive 连接方式大全

overfit同步小助手 2024-10-12 23:03:50 0 收藏

Win10 IDEA连接虚拟机中的Hadoop（HDFS）

Win10 IDEA连接虚拟机中的Hadoop、HDFS

overfit同步小助手 2024-10-12 23:03:29 0 收藏

RabbitMQ Demo 项目教程

RabbitMQ Demo 项目教程 RabbitMqDemo 项目地址: https://gitcode.com/gh_mirrors/ra/

overfit同步小助手 2024-10-12 22:03:52 0 收藏

RabbitMQ 消息队列：生产者与消费者实现详解

在分布式系统中，消息队列（Message Queue, MQ）是一种重要的组件，用于解耦系统、异步处理任务以及实现系统间的通信。RabbitMQ 是一个流行的开源消息代理软件，它实现了高级消息队列协议（AMQP）。在本文中，我们将通过 Java 示例来演示如何使用 RabbitMQ 的生产者和消费者

overfit同步小助手 2024-10-12 22:03:45 0 收藏

kafka的ISR机制详解

在实际操作中，Kafka不会等待所有五个副本都确认消息后再认为消息已提交，ISR的做法是先设置几个队列(如设置3个，一般要为奇数个，不然zookeeper的过半选举机制容易难以进行)，作为ISR队列，要求leader同步完这个两个才算完成，而其他的副本作为followers队列，不要求及时同步。这样

overfit同步小助手 2024-10-12 19:03:57 0 收藏

基于大数据爬虫+数据可视化与大数据分析的网络电视剧收视率分析系统设计与实现（附源码+论文+部署指南）

基于Hive的网络电视剧收视率分析系统是一个高效、精确的数据管理与分析平台，旨在为电视传媒机构和观众提供一个全面的收视率数据解决方案。通过利用Hive的大数据处理能力，该系统能够存储和分析海量的收视数据，从而揭示不同电视剧的受欢迎程度和观众偏好。管理员可以通过系统管理模块轻松地更新用户信息、发布公告

overfit同步小助手 2024-10-12 19:03:33 0 收藏

毕业设计大数据电商用户行为分析及可视化(源码+论文)

今天学长向大家介绍一个机器视觉的毕设项目，大数据电商用户行为分析及可视化(源码+论文)毕业设计基于大数据淘宝用户行为分析🧿 项目分享:见文末!

overfit同步小助手 2024-10-12 18:03:46 0 收藏

Spark-RDD（Resilient Distributed Dataset）图文详解

Spark-RDD概述

overfit同步小助手 2024-10-12 18:03:34 0 收藏

大数据新视界 --大数据大厂之大数据驱动下的物流供应链优化：实时追踪与智能调配

本文深入探讨大数据在物流供应链中的重要性、应用场景、技术实现及前沿应用探索，通过案例分析展现其在实时追踪与智能调配方面的强大作用，同时强调数据安全与隐私保护。

overfit同步小助手 2024-10-12 18:03:25 0 收藏

启动hive元数据服务

overfit同步小助手 2024-10-12 16:03:51 0 收藏

2024年Gartner企业备份与恢复解决方案的魔力象限报告解读｜新鲜首发附报告原文链接

Gartner 将企业备份和恢复软件解决方案定义为在本地、混合、多云和软件即服务 (SaaS) 环境中捕获企业数据的时间点副本（备份）的技术。这些解决方案将这些数据写入一个或多个辅助存储目标，主要目的是在数据损坏或者丢失时能够及时恢复数据。保护和恢复业务应用程序数据（无论底层基础设施类型及其位置如何

overfit同步小助手 2024-10-12 16:03:39 0 收藏

基于大数据的电子产品需求数据分析系统的设计与实现(Python Vue Flask Mysql)

本研究旨在设计并实现一个基于大数据的电子产品需求数据分析系统，以协助企业更精准地预测市场需求、优化资源配置，并提升市场竞争力。系统以Python、Vue、selenium、Echarts、Hadoop和MySQL为技术基础，利用selenium技术实现淘宝电子产品数据的抓取，并将数据存储于Hadoo

overfit同步小助手 2024-10-12 15:03:56 0 收藏

大数据岗位:数据开发工程师,数据分析师,报表BI工程师的介绍和区别

大数据岗位基本概述,数开,数分,数据报表BI工程师

overfit同步小助手 2024-10-12 15:03:46 0 收藏