大数据 - overfit.cn

【Hadoop】实践总结

本文将以离线批处理大数据为例，演示简单的Hadoop流程，不作过多理论概念介绍。具体内容具体可分为：1、文件导入Hdfs；2、MapReduce作业；3、Hive建模；4、Sqoop数据抽取。

overfit同步小助手 2024-03-31 16:03:53 0 收藏

大数据毕设分享深度学习图像风格迁移系统(源码分享)

今天学长向大家分享一个毕业设计项目毕业设计深度学习图像风格迁移系统(源码分享)毕业设计深度学习图像风格迁移系统图片风格迁移指的是将一个图片的风格转换到另一个图片中，如图所示：原图片经过一系列的特征变换，具有了新的纹理特征，这就叫做风格迁移。

overfit同步小助手 2024-03-31 16:03:47 0 收藏

Flink与Spring Boot集成实践：搭建实时数据处理平台

在当今数据风暴的时代，实时数据处理已经成为众多企业关注的热点。Apache Flink作为一个高性能、可扩展的实时计算框架，在实时数据处理领域占据着举足轻重的地位。Spring Boot则以其快速开发、简化配置而广受欢迎，将两者结合，我们可以快速地搭建起一个实时数据处理平台。本文将详细讲述如何将Fl

overfit同步小助手 2024-03-31 15:03:47 0 收藏

使用MySQL的日志和Kafka同步数据

配置Kafka Connect：编辑Kafka Connect的配置文件，将MySQL Connector插件的相关配置添加到配置文件中。安装Kafka Connect：Kafka Connect是Kafka的插件框架，它允许你使用各种连接器来将数据从外部系统导入和导出到Kafka中。启动Kafka

overfit同步小助手 2024-03-31 13:03:52 0 收藏

zookeeper集群安装后启动失效

zoo.cfg配置文件里dataDir指定的那个目录下需要有myid文件，如果没有则创建。检查java版本，有些时候会发现java版本对应的是openjdk，需要将openjdk删除，重新将java变量配置文件运行一遍。本机对应的ip是192.168.20.102，则在myid文件中填入前面 ser

overfit同步小助手 2024-03-31 13:03:33 0 收藏

xsync和myhadoop.sh中shell脚本的解释

逐句解释xsncy和myhadoop.sh脚本的解释。

overfit同步小助手 2024-03-31 13:03:18 0 收藏

SpringBoot3的RabbitMQ消息服务

配置一个fanout类型的交换器，不需要指定对应的路由键（Routing key），同时会将消息路由到每一个消息队列上，然后每个消息队列都可以对相同的消息进行接收存储，在同一交换器下的所有队列都将收到消息。配置一个direct类型的交换器，并指定不同的路由键值（Routing key）将对应的消息从

overfit同步小助手 2024-03-31 12:03:39 0 收藏

【数仓】Kafka消息可视化工具：Offset Explorer（原名kafka Tool）

Offset Explorer（以前称为Kafka Tool）是一个用于管理和使用Apache Kafka®集群的GUI应用程序。它提供了一个直观的界面，允许用户快速查看Kafka集群中的对象以及集群主题中存储的消息。它包含面向开发人员和管理员的功能。Offset Explorer仅供个人使用。未经

overfit同步小助手 2024-03-31 12:03:36 0 收藏

kafka的Docker镜像使用说明(wurstmeister/kafka)

在hub.docker.com网站上，Star最多的kafka镜像是wurstmeister/kafka，今天一起来实践这个镜像，使用此镜像搭建kafka环境，并且生产和消费消息；

overfit同步小助手 2024-03-31 10:03:41 0 收藏

RabbitMQ之“延时队列”

延迟队列存储的对象是对应的延迟消息，所谓“延迟消息”是指当消息被发送以后，并不想让消费者立刻拿到消息，而是等待特定时间后，消费者才能拿到这个消息进行消费

overfit同步小助手 2024-03-31 08:03:32 0 收藏

数据仓库概述

数据仓库是一个面向主题的、集成的、相对稳定的、反映历史变化的数据集合，用于支持管理决策，它是一种与时间相关的、不可修改的数据集合。

overfit同步小助手 2024-03-31 07:03:51 0 收藏

Mysql之pt-archiver工具（数据库归档利器）

数据库管理员或者运维人员经常需定期对数据进行归档和清除，我们可以使用的Percona的PT-归档工具能完成这一功能，使得数据归档变得方便简单。官网地址。

overfit同步小助手 2024-03-31 07:03:18 0 收藏

Kafka SASL_SSL双重认证

kafka提供了多种安全认证机制，主要分为SASL和SSL两大类。在 Kafka 中启用 SASL_SSL 安全协议时，SASL 用于客户端和服务器之间的身份验证，SSL 则用于加密和保护数据的传输。不仅提供身份验证，还提供加密和数据保护的功能。因工作需要，需要在测试环境搭建一套基于SASL_SSL

overfit同步小助手 2024-03-31 06:03:29 0 收藏

Spring Boot中使用Kafka时遇到“构建Kafka消费者失败“的问题

在使用Spring Boot集成Kafka时，可能会遇到"构建Kafka消费者失败"的错误。本文提供了一些可能的解决方案，包括检查Kafka依赖、配置、服务器连接、消费者配置和权限等方面。本文将探讨在Spring Boot应用程序中使用Kafka时可能遇到的"构建Kafka消费者失败"错误，并提供解

overfit同步小助手 2024-03-31 06:03:21 0 收藏

Spark—GraphX实战 OneID

ID Mapping 是OneID 的提前，OneID 是ID Mapping 的结果，所以要想做OneID必须先做ID MappingOneID 是为了打通整个数据体系的数据，所以OneID 需要以服务的方式对外提供服务，在数仓里面就是作为基础表使用，对外的话我们就需要提供接口对外提供服务。

overfit同步小助手 2024-03-31 04:03:48 0 收藏

hadoop集群搭建、spark集群搭建、pyspark搭建（linux+window）

linux和window上安装pyspark库。

overfit同步小助手 2024-03-31 03:03:52 0 收藏

数据治理——滴滴大数据成本治理实践

overfit同步小助手 2024-03-31 03:03:35 0 收藏

puppet-rabbitmq: 简化RabbitMQ的自动化配置管理

puppet-rabbitmq: 简化RabbitMQ的自动化配置管理项目简介puppet-rabbitmq是Vox Pupuli组织开发的一个Puppet模块，旨在简化RabbitMQ服务器的自动化配置管理。通过使用此模块，您可以轻松地安装、管理和扩展RabbitMQ集群。能用来做什么？安装Rab

overfit同步小助手 2024-03-31 02:03:58 0 收藏

【快捷部署】002_Flink（1.17.2）

快捷部署系列，本期带来的是Flink，快速体验、学习

overfit同步小助手 2024-03-31 02:03:53 0 收藏

RabbitMQ 的高阶应用及可靠性保证

上篇文章介绍了 RabbitMQ 的基本概念和使用，这篇文章就来介绍下其高阶应用和可靠性保证。

overfit同步小助手 2024-03-31 02:03:28 0 收藏