大数据 - overfit.cn

Kafka 的零拷贝原理

Kafka的零拷贝（Zero-Copy）原理是通过减少或消除数据在内核态和用户态之间的拷贝次数，从而提高数据传输的效率和性能。这一原理的实现主要依赖于操作系统提供的底层支持，特别是直接内存映射（Direct Memory Mapping）和sendfile系统调用等机制。

overfit同步小助手 2024-11-23 00:03:55 0 收藏

Hadoop的汽车销量数据分析系统

随着大数据技术的快速发展，基于大数据的分析应用日益普及。本论文针对汽车行业，本论文设计并实现了一个基于Hadoop的汽车销量数据分析系统，旨在提供汽车行业的决策支持和市场洞察。系统首先通过网络爬虫和API等方式采集汽车销量数据，然后利用Hadoop生态系统中的HDFS组件进行数据清洗、存储和处理。在

overfit同步小助手 2024-11-23 00:03:45 0 收藏

毕设项目大数据用户画像分析系统(源码分享)

Hi，大家好，这里是丹成学长，今天做一个电商销售预测分析，这只是一个demo，尝试对电影数据进行分析，并可视化系统🔥 这两年开始毕业设计和毕业答辩的要求和难度不断提升，传统的毕设题目缺少创新和亮点，往往达不到毕业答辩的要求，这两年不断有学弟学妹告诉学长自己做的项目系统达不到老师的要求。为了大家能够

overfit同步小助手 2024-11-23 00:03:22 0 收藏

Spring Boot中使用RabbitMQ 生产消息和消费消息

RabbitMQ 中的交换机（Exchange）是消息路由的核心组件。它负责接收来自生产者发送的消息，并根据特定的路由规则将这些消息传递给一个或多个队列（Queue）。交换机的主要功能和类型。在扇出交换机中，可以将路由键设置为空字符串 “”，因为扇出交换机会将消息发送到所有绑定的队列，而不需要考虑路

overfit同步小助手 2024-11-23 00:03:17 0 收藏

深入解读 Kafka：架构设计与核心源码解析

从Kafka的角度来看：1. Kafka是一个分布式的、基于发布-订阅模式的消息队列系统，用于构建实时数据流管道和流应用程序。2. Kafka使用主题（Topic）来组织和存储消息，生产者（Producer）向主题发布消息，消费者（Consumer）从主题订阅并消费消息。3. Kafka具有高吞吐量

overfit同步小助手 2024-11-22 23:06:53 0 收藏

基于电商大数据的商品推荐系统

商品推荐系统，电商大数据，协同过滤，内容过滤，矩阵分解，深度学习，推荐算法1. 背景介绍在当今数据爆炸的时代，电商平台积累了海量用户行为数据，这些数据蕴藏着丰富的商品推荐价值。商品推荐系统作为电商平台的核心功能之一，能够根据用户的兴趣偏好、购买历史、浏览记录等信息，精准推荐合适的

overfit同步小助手 2024-11-22 22:03:43 0 收藏

rabbitMQ

d \可以看到在安装命令中有两个映射的端口：- 15672：RabbitMQ提供的管理控制台的端口- 5672：RabbitMQ的消息发送处理接口1 交换机发消息的时候必须绑定相应的队列2 绑定了的队列都能收到交换机发送的消息模拟WorkQueue，实现一个队列绑定多个消费者基本思路如下:1.在

overfit同步小助手 2024-11-22 21:03:43 0 收藏

多条Kafka消息的key重复会怎样？

在org.apache.kafka.clients.producer.internals.DefaultPartitioner#partition方法中的注释【keyBytes serialized key to partition on (or null if no key)】可以看到，会通过ke

overfit同步小助手 2024-11-22 20:03:52 0 收藏

HIVE4.0.1在Hadoop HA部署hiveserver2模式

HIVE的远程模式部署

overfit同步小助手 2024-11-22 20:03:31 0 收藏

zkCli常用命令+ Zookeeper实战

zkCli 是 ZooKeeper 提供的一个命令行工具，用于与 ZooKeeper 集群进行交互和调试。

overfit同步小助手 2024-11-22 20:03:24 0 收藏

RabbitMQ高效的消息队列中间件原理及实践

RabbitMQ 是一个功能强大的消息队列中间件，提供了高效的消息传递机制和灵活的路由策略。通过使用 PHP 的库，开发者可以轻松地与 RabbitMQ 进行交互，实现生产者和消费者的功能。

overfit同步小助手 2024-11-22 18:04:19 0 收藏

RabbitMQ 发布确认高级部分

备份交换机（Dead Letter Exchange, DLX）是用来处理未能成功消费的消息的机制。当消息在队列中达到最大重试次数或过期时，它会被转发到备份交换机。

overfit同步小助手 2024-11-22 18:04:14 0 收藏

oracle和hive之间关于sql的语法差异及转换

Oracle与hive相互转换

overfit同步小助手 2024-11-22 18:04:11 0 收藏

结合人工智能，大数据，物联网等主流技术实现业务流程的闭环整合的智慧快消开源了。

智慧快消视频监控平台是一款功能强大且简单易用的实时算法视频监控系统。它的愿景是最底层打通各大芯片厂商相互间的壁垒，省去繁琐重复的适配流程，实现芯片、算法、应用的全流程组合，从而大大减少企业级应用约95%的开发成本。基于多年的深度学习技术研究和业务应用为基础，集深度学习核心训练和推理框架、基础模型库、

overfit同步小助手 2024-11-22 17:03:51 0 收藏

Spark快速入门与实战案例解析

在当今的大数据时代，数据处理速度与效率成为了竞争的关键。作为一款开源的分布式计算框架，Apache Spark 以其高效的内存计算和简洁的编程模型，迅速成为数据工程师和科学家们的必备工具。无论是批量数据处理，还是实时数据流分析，Spark 都可以游刃有余地胜任。本篇文章将围绕【Spark 快速入门】

overfit同步小助手 2024-11-22 17:03:47 0 收藏

hive分区详细教程

为了提高sql的查询效率比如：假如数据量比较大，这个sql就是全表扫描，速度肯定慢。可以将数据按照天进行分区，一个分区就是一个文件夹，当你查询20230826的时候只需要去20230826这个文件夹中取数据即可，不需要全表扫描，提高了查询效率。总结1）分区表实际上就是对应一个HDFS文件系统上的独立

overfit同步小助手 2024-11-22 16:03:34 0 收藏

使用Python实现对接Hadoop集群（通过Hive）并提供API接口

安装必要的库首先，确保已经安装了以下库：代码实现。

overfit同步小助手 2024-11-22 16:03:29 0 收藏

zookeeper实现RMI服务，高可用，HA

客户端在调用RMI服务时，可以通过ZooKeeper获取到多个服务端的地址，并根据一定的策略（如轮询、随机等）选择一个进行调用。因此，这样的同名服务，同时运行，但是端口不一致，客户端在调用这样的服务时，随机选取(自定义选取也可以)一个znode节点，调用rmi服务。首先一个服务端只能运行于一台服务中

overfit同步小助手 2024-11-22 15:08:32 0 收藏

Idea 中kafka 生产者无法正常生产消息，SpringBoot编写简单的kafka实例

在idea中，kafka无法消费生产者的信息，无法正常退出。首先观察kafka9092端口和zookeeper的2181端口的是否对外开放。

overfit同步小助手 2024-11-22 15:08:11 0 收藏

大数据实训室中，高职大数据可视化开发技术实训课程改革研究

本文针对大数据可视化开发技术课程的特点，提出了融入OBE教学模式的建议，强调学生自主学习的重要性，并建议教师根据学生的学情，以学生为主体，以成果为导向，设计教学活动，实现教师教学与学生学习的有机结合，从而全面提升教学效果。鉴于高职院校学生基础参差不齐，教学中需了解学生的学情，制定相应的教学活动，并及

overfit同步小助手 2024-11-22 14:03:38 0 收藏