大数据 - overfit.cn

大数据技术之 Hadoop（入门详解）

各个模块分开启动/停止（配置 ssh 是前提）常用整体启动/停止 HDFS整体启动/停止 YARN各个服务组件逐一启动/停止分别启动/停止 HDFS 组件启动/停止 YARN。

overfit同步小助手 2024-10-13 22:03:48 0 收藏

毕设大数据电商用户行为分析及可视化(源码+论文)

今天学长向大家介绍一个机器视觉的毕设项目，大数据电商用户行为分析及可视化(源码+论文)毕业设计基于大数据淘宝用户行为分析🧿 项目分享:见文末!

overfit同步小助手 2024-10-13 21:04:24 0 收藏

Logstash-Kafka集成指南

Logstash-Kafka集成指南 logstash-kafkaKafka plugin for Logstash项目地址:https://gitcode.com/gh_mirrors/lo/logstash-kafka 1. 项目目录结构及介绍Logstash的Kafka插件是一个让Logsta

overfit同步小助手 2024-10-13 21:04:14 0 收藏

基于Linux和C++实现的RabbitMQ风格消息队列：设计与实现

源码该文件定义了客户端服务器通信时所用到的请求和响应；由于参数需要进⾏⽹络传输以及序列化，所以需要将参数定义在pb⽂件中。

overfit同步小助手 2024-10-13 19:03:45 0 收藏

通过 Flink 的火焰图定位反压

在 Apache Flink 中，Web UI 提供了丰富的监控工具来帮助用户分析和解决作业性能问题，其中火焰图（Flame Graph）是用于分析反压问题的一个强有力的工具。通过 Flink 的火焰图，你可以清晰地了解作业中各个算子的 CPU 时间分布，进而发现处理速度慢的地方。火焰图不仅能够帮助

overfit同步小助手 2024-10-13 19:03:40 0 收藏

RabbitMQ如何保证消息不丢失

可以选择用 RabbitMQ 提供的事务功能，就是生产者发送数据之前开启 RabbitMQ 事务channel.txSelect，然后发送消息，如果消息没有成功被 RabbitMQ 接收到，那么生产者会收到异常报错，此时就可以回滚事务channel.txRollback，然后重试发送消息；Rabbi

overfit同步小助手 2024-10-13 17:03:49 0 收藏

【笔记】Hive基础

Hive基础知识点，基本语法与操作

overfit同步小助手 2024-10-13 17:03:38 0 收藏

大数据导论：基础知识与应用实例

本文还有配套的精品资源，点击获取简介：大数据，作为现代信息技术领域的热点议题，被福建师范大学精品课程深入探讨。本课程系列的第二部分第*单元介绍大数据的基本概念、关键特性及其在各领域的广泛应用。PPT材料通过详细的讲解和案例分析，帮助学生和专业人士理解大数据的本质和实践技术，包括其处理框架、分析

overfit同步小助手 2024-10-13 15:03:33 0 收藏

推荐文章：探索大数据的火花 —— 学习Spark示例项目

推荐文章：探索大数据的火花 —— 学习Spark示例项目 learning-spark-examples Examples for learning spark

overfit同步小助手 2024-10-13 12:04:02 0 收藏

Hadoop（MapReduce）

MapReduce是一个分布式运算程序的编程框架，是用户开发“基于Hadoop的数据分析应用”的核心框架。MapReduce核心功能是将用户编写的业务逻辑代码和自带默认组件整合成一个完整的分布式运算程序，并发运行在一个Hadoop集群上。

overfit同步小助手 2024-10-13 12:03:58 0 收藏

KDP场景教程 | 如何与 KDP 上的 Kafka 快速集成

KDP 提供的云原生 Kafka 是一个分布式的消息队列系统，具有高吞吐量、高可用性、高容错性等特点，适用于大规模数据处理场景。为支持用户快速搭建 Kafka 集群，KDP 提供了 Kafka 集群应用，用户可以通过 KDP-ux 一键安装 Kafka 集群，支持消息的生产和消费需求。为支持用户进行

overfit同步小助手 2024-10-13 12:03:53 0 收藏

Flink源码剖析

执行环境 ExecutionEnvironment数据抽象 DataSet DataStream逻辑操作 Source Transformation Sink1. 获取执行环境2. 通过执行环境对象，注册数据源Source，得到数据抽象3. 调用数据抽象的各种Transformation执行逻辑计算

overfit同步小助手 2024-10-13 12:03:48 0 收藏

kafka mirror maker之实现两个kafka集群之间的数据同步

Kafka MirrorMaker 是 Apache Kafka 提供的一个用于在不同 Kafka 集群之间复制数据的工具。它的主要用途是在多个数据中心、地理位置或集群之间实现数据同步和冗余，以提升数据的高可用性和容灾能力。以下是关于 Kafka MirrorMaker 的详细介绍。Kafka Mi

overfit同步小助手 2024-10-13 12:03:41 0 收藏

快速搞定分布式RabbitMQ---RabbitMQ进阶与实战

1.防火墙需要添加5672以及15672端口，防火墙允许其开放第一个命令：firewall-cmd --add-port=5672/tcp --permanent显示执行成功：success但是使用：firewall-cmd --query-port=5672/tcp查询的时候未查询到2.hostn

overfit同步小助手 2024-10-13 11:03:53 0 收藏

NiFi安装指南

通过以上步骤，你应该能够在你的系统上成功安装并运行 Apache NiFi。NiFi 提供了强大的数据处理和分发功能，适用于各种数据流处理场景。希望这篇博客对你有所帮助！

overfit同步小助手 2024-10-13 11:03:48 0 收藏

Apache Iceberg 与 Spark整合-使用教程（Iceberg 官方文档解析）

spark & iceberg

overfit同步小助手 2024-10-13 11:03:37 0 收藏

Hadoop HA高可用集群搭建：一站式解决方案

Hadoop HA高可用集群搭建：一站式解决方案 HadoopHA高可用搭建保姆级教程大二学长的万字笔记项目地址: https://gitco

overfit同步小助手 2024-10-13 11:03:16 0 收藏

Spark编程模型与函数式编程

《Spark编程模型与函数式编程》作者：禅与计算机程序设计艺术 / Zen and the Art of Computer Programming1. 背景介绍1.1 问题的由来随着大数据时代的到来，数据处理和分析的需求

overfit同步小助手 2024-10-13 10:03:38 0 收藏

Hive数仓操作（十五）

Hive 开窗函数窗口函数的基本组成部分窗口边界标识符窗口边界函数示例数据集SQL 查询运行结果1. 查询在2017年4月份购买过的顾客Hive窗口函数是一种特殊的函数，允许用户在查询中对一组行进行计算，而不仅仅是单独的行。窗口函数可以在 SQL 查询中进行聚合、排名、累积计算等。这使得窗口函数在数

overfit同步小助手 2024-10-13 09:04:17 0 收藏

yum不可用

当使用yum命令安装xx时，出现“Cannot find a vaild baseurl for repo：base”的错误，通常意为着yum源配置不正确或网络连接问题。

overfit同步小助手 2024-10-13 09:04:05 0 收藏