大数据 - overfit.cn

RabbitMq的惰性队列（Lazy Queue）、优先级队列（Priority Queue）

RabbitMQ从3.6.0版本开始引入惰性队列，它是一种以惰性模式运行的经典队列。当设置“惰性”队列模式时，经典队列中的消息将尽可能早地移动到磁盘。这些消息只有在消费者请求时才被加载到RAM中。也就是说生产者发送消息到RabbitMq时，这些消息会直接写入到磁盘上，而不是先加载到内存中；当消费者需

overfit同步小助手 2024-12-02 10:03:44 0 收藏

Hadoop高可用集群搭建，NameNode启动不成功问题,DFSZKFailoverController启动不成问题

有一个完整并且搭建成功，可以启动的zookeeper集群！没搭建好zookeeper的去博主的上一篇文章搭建一下。

overfit同步小助手 2024-12-02 10:03:24 0 收藏

基于springboot+vue的Hadoop的手机销售数据分析系统(源码+文档+部署讲解等)

基于 springboot + vue 的 Hadoop 的手机销售数据分析系统是一款功能强大的商业分析工具，包含源码、文档和部署讲解等。系统可全面收集手机销售相关数据，涵盖手机品牌、型号、价格、配置、销售时间、销售区域、销售数量、销售额等信息。利用 Hadoop 的分布式存储和处理优势，高效处理海

overfit同步小助手 2024-12-02 09:03:49 0 收藏

大数据-233 离线数仓 - 留存会员需求、创建与加载DWS 层、ADS 层与小结

DWS 层通常被称为数据仓库服务层或明细层，它是数据仓库架构中的中间层，负责将原始数据经过清洗、转换后进行存储，并提供给下游的数据应用层或分析层使用。ADS 层是面向应用的数据服务层，主要聚焦于业务的直接需求和决策支持，提供高性能和高响应的数据查询能力，通常是直接为应用或决策系统提供服务。DWS 层

overfit同步小助手 2024-12-02 09:03:38 0 收藏

hbase单机版(依赖于内置的zookeeper)安装配置及详细使用教程

1、因为hbase默认通过hostname去找ip然后将这个ip注册到zookeeper中作为hbase单机服务的ip地址。安装的hbase不依赖于hadoop，且使用hbase内置的zookeeper，不依赖于外部zookeeper。2、在windows端修改hosts文件文件路径： C:\Wi

overfit同步小助手 2024-12-02 09:03:35 0 收藏

【大数据学习 | HBASE高级】hbase-phoenix 与二次索引应用

上面我们学会了hbase的操作和原理，以及外部集成的mr的计算方式，但是我们在使用hbase的时候，有的时候我们要直接操作hbase做部分数据的查询和插入，这种原生的方式操作在工作过程中还是比较常见的，以上这些方式需要使用外部的框架进行协助处理，其实hbase也对外提供了一个直接的操作方式接口插件P

overfit同步小助手 2024-12-02 08:03:33 0 收藏

RabbitMQ 的工作模式

RabbitMQ 共提供了 7 种工作模式进行消息传递，在本篇文章中，我们就来学习 RabbitMQ 的工作模式

overfit同步小助手 2024-12-02 08:03:26 0 收藏

【大数据学习 | kafka】kafka的偏移量管理

一般我们都会选择异步提交方式，他们的功能都是将拉取到的一整批数据的最大偏移量直接提交到__consumer_offsets中，但是同步方式会很浪费资源，异步方式虽然不能保证稳定性但是我们的偏移量是一直递增存储的，所以偶尔提交不成功一个两个不影响我们的使用。但是我们不能随意的指定消费者消费数据的位置，

overfit同步小助手 2024-12-02 07:03:39 0 收藏

毕设项目分享大数据房价数据分析及可视化(源码分享)

今天分享一个大数据毕设项目：毕设分享大数据房价数据分析及可视化(源码分享)🧿 项目分享:见文末!实现效果毕业设计房价大数据可视化分析网络爬虫是一种按照一定的规则，自动地抓取万维网信息的程序或者脚本。爬虫对某一站点访问，如果可以访问就下载其中的网页内容，并且通过爬虫解析模块解析得到的网页链接，把

overfit同步小助手 2024-12-02 05:03:28 0 收藏

大数据技术之Hadoop ：我是恁爹

不关注大数据的可能对这两个名词比较陌生，但是Hadoop大家一定都听说过吧。HDFS 和 MapReduce 就是 Hadoop 项目中的两个核心组件，。

overfit同步小助手 2024-12-02 04:03:37 0 收藏

Internet Archive Downloader 使用教程

Internet Archive Downloader 使用教程 internet_archive_downloaderA chrome/firefox extension that download books from Internet Archive(archive.org) and Hath

overfit同步小助手 2024-12-02 04:03:22 0 收藏

RabbitMQ 消息队列

RabbitMQ 是一个开源的消息代理和队列服务器，它支持多种消息协议，包括 AMQP（高级消息队列协议），MQTT，STOMP 等。RabbitMQ 被广泛用于异步消息处理、事件驱动架构、微服务架构等场景。RabbitMQ 提供了灵活的路由功能、高可用性、持久化、集群和多种语言的客户端库，使其成为

overfit同步小助手 2024-12-02 03:03:36 0 收藏

【02基础】- RabbitMQ基础

RabbitMQ 基础

overfit同步小助手 2024-12-02 02:03:31 0 收藏

Flink中的Savepoints和Checkpoints有什么区别？

触发方式Checkpoints 是自动触发的，用户可以配置触发频率。Savepoints 是手动触发的，用户根据需要决定何时创建 Savepoint。用途Checkpoints 用于实现应用程序的容错，确保在发生故障时可以从最近的检查点恢复状态。Savepoints 用于应用程序的版本迁移和状态转移

overfit同步小助手 2024-12-02 01:03:39 0 收藏

RabbitMQ 中保证消息不被重复消费

在分布式系统中，消息的可靠传输和处理至关重要。RabbitMQ 作为一个常用的消息队列中间件，提供了丰富的功能来保证消息的可靠传输。但是，由于网络故障、服务宕机等原因，消息有可能被重复消费。如果没有处理好重复消费问题，可能会导致系统产生不一致性。为了解决这个问题，RabbitMQ 提供了一些机制来防

overfit同步小助手 2024-12-02 00:03:23 0 收藏

Kafka之生产者

对Kafka体系结构中的生产者的相关基本知识和原理来进行介绍

overfit同步小助手 2024-12-02 00:03:16 0 收藏

Data+AI━━深夜对话硅谷大佬：云计算、大数据、AI走向融合是必然还是偶然？

overfit同步小助手 2024-12-01 23:03:54 0 收藏

探索未来科技前沿：云计算与大数据的深度融合

在当今这个数字化时代，信息技术（IT）的发展日新月异，其中云计算与大数据作为两大核心驱动力，正以前所未有的速度重塑着各行各业的生态格局。本文旨在深入探讨这一前沿趋势，揭秘云计算与大数据如何携手并进，共同开启智慧未来的新篇章。

overfit同步小助手 2024-12-01 22:03:32 0 收藏

Hadoop 不再孤单：与 Spark、Hive、Flume 组合的强大威力

通过这篇文章，我们了解了如何设计一个基于Hadoop的分布式文件处理系统。如今在大数据领域单独使用Hadoop的还是比较少的，更多的是与其他大数据技术栈结合使用，形成一个完整的大数据生态系统。Hadoop作为大数据处理的基础框架，虽然功能强大，但在某些方面也存在一些局限性，比如实时处理能力不足、复杂

overfit同步小助手 2024-12-01 21:03:51 0 收藏

如何在Hadoop中管理和优化大量的元数据？

在Hadoop中管理和优化大量的元数据是确保集群高效运行和维护的关键。元数据管理涉及HDFS的元数据、Hive的元数据、以及各种其他组件的元数据。

overfit同步小助手 2024-12-01 20:03:16 0 收藏