大数据 - overfit.cn

Docker 删除镜像

Docker 删除镜像是一个常见的操作，用于清理不再需要的镜像，以节省存储空间。

overfit同步小助手 2024-09-27 02:03:48 0 收藏

Flink系列--Flink监控告警初探

overfit同步小助手 2024-09-27 02:03:25 0 收藏

安踏质量问题频发，奥运赞助难掩尴尬

面对消费者的质疑和投诉，安踏官方却迟迟未能给出令人信服的解释和解决方案。

overfit同步小助手 2024-09-27 01:03:52 0 收藏

dubbo：dubbo+zookeeper整合nginx实现网关（四）

首先针对nginx的学习我们早在nginx专栏就已经从零说明过，如果对于该组件的基础使用还未掌握的，建议大家可以先学习下nginx专栏Nginx快速上手专栏在本期文章中重点涉及其中如下几篇内容Nginx应用场景、安装、部署及设置开机自启（一）负载均衡upstream配置详解（四）nginx各类转发、

overfit同步小助手 2024-09-27 01:03:25 0 收藏

Kafka和Zookeeper的安装与使用指南

在分布式系统的世界中，Kafka是一种高性能的消息队列系统，而Zookeeper则作为分布式协调服务的基础工具之一，为Kafka的高效运行提供支持。本指南将详细介绍在Windows和Linux系统中安装和配置Zookeeper和Kafka的步骤，并包含一些常用命令和经验总结，帮助你更好地掌握这些工具

overfit同步小助手 2024-09-27 00:03:55 0 收藏

毕设成品基于大数据情感分析的网络舆情分析系统(源码+论文)

Python下有多款不同的 Web 框架，Django是最有代表性的一种。许多成功的网站和APP都基于Django。Django是一个开源的Web应用框架，由Python写成。Django采用了MVC的软件设计模式，即模型M，视图V和控制器C。

overfit同步小助手 2024-09-27 00:03:44 0 收藏

消息队列-Kafka（概念篇）

总结下kafka相关概念

overfit同步小助手 2024-09-27 00:03:32 0 收藏

数据仓库技术选型方案文档

Flink CDC 是 Flink 的子项目，是 Flink 的一组原连接器，用于 CDC 从不同数据库接收/更改数据，Flink CDC 将 Debezium 集成为引擎，异步或数据更改，因此 Flink CDC 可以充分使用和发挥 Debezium 的能力，并且可以无缝对接 Flink 使用其

overfit同步小助手 2024-09-26 22:03:56 0 收藏

大数据-143 - ClickHouse 集群 SQL 超详细实践记录！

ClickHouse 是一种用于 OLAP（在线分析处理）的列式数据库，因其高速数据处理能力在大数据分析中备受青睐。ClickHouse 的 SQL 语法与标准 SQL 类似，但由于其专注于分析场景，有一些特殊的扩展。ClickHouse 默认不支持直接 DELETE 或 UPDATE 操作，但可以

overfit同步小助手 2024-09-26 20:03:40 0 收藏

11.6 Spark Streaming

(8)IDEA打开Streaming2.scala,设置自己的hdfs地址,可以使用以下代码查看在虚拟机,并且更改IDEA第7 12行的代码。（1）打开FileStreaming.scala文件，使用Maven打包，并且复制到app文件夹下。打开DStreaming.scala，修改19行的ip地址

overfit同步小助手 2024-09-26 19:04:07 0 收藏

4. kafka消息监控客户端工具

本项目是一个kaf秋aGU客户端，支持各个系统，开源免费、简单好用。

overfit同步小助手 2024-09-26 19:03:55 0 收藏

RabbitMQ练习（Publish/Subscribe）

将把同一个消息传递给多个消费者，这种模式被称为"发布/订阅"（publish/subscribe）模式。下面是对这个概念的解读：发布/订阅模式：这是一种消息通信模式，其中消息的发布者（发布者）不会将消息直接发送给特定的接收者（订阅者）。相反，消息会被发布到一个主题（topic）或频道（channel

overfit同步小助手 2024-09-26 18:03:47 0 收藏

Hive原理剖析

Apache Hive是一个基于Hadoop的开源数据仓库软件，为分析和管理大量数据集提供了SQL-like的接口。最初由Facebook开发并贡献给Apache，Hive现已成为大数据处理领域的重要工具之一。它将传统的SQL功能与Hadoop的强大分布式处理能力结合，使用户可以通过熟悉的SQL语法

overfit同步小助手 2024-09-26 18:03:39 0 收藏

数据仓库与数据湖原理与代码实战案例讲解

数据仓库与数据湖原理与代码实战案例讲解关键词：数据仓库（Data Warehouse）数据湖（Data Lake）数据集成（Data Integration）ETL（Extract, Transform, Loa

overfit同步小助手 2024-09-26 17:03:46 0 收藏

kafka 一步步探究消费者组与分区分配策略

本期主要聊聊kafka消费者组与分区。

overfit同步小助手 2024-09-26 16:03:20 0 收藏

java重点学习-RabbitMQ+Kafka

并且使用起来也非常简单，不需要额外的配置，在声明队列的时候只要指定这个是仲裁队列即可。，与镜像队列一样，都是主从模式，支持主从数据同步，主从同步基于。，如果消费者关联了多个，分区不能保证顺序性，，要消费消息时才会从磁盘中读取并加载到内存。中，每个分区都有一个按照顺序的存储的。一个topic的数据可能

overfit同步小助手 2024-09-26 15:03:51 0 收藏

Jackdaw：Clojure开发者的Apache Kafka利器

Jackdaw：Clojure开发者的Apache Kafka利器 jackdawA Clojure library for the Apache Kafka distributed streaming platform.项目地址:https://gitcode.com/gh_mirrors/ja/

overfit同步小助手 2024-09-26 15:03:37 0 收藏

计算机毕设设计推荐-基于python+Djanog大数据的电影数据可视化分析

随着互联网的快速发展，影视行业的数据规模逐渐增大，电影的相关数据呈现出海量、多样化的特点。传统的数据分析方式难以有效处理和分析这些庞杂的电影数据，无法为用户提供准确、全面的电影推荐及消费指导。此外，电影行业的用户行为分析和市场趋势预测也面临数据处理性能和可视化展示的挑战。因此，开发一个基于大数据技术

overfit同步小助手 2024-09-26 14:03:33 0 收藏

Docker 部署 RabbitMQ (图文并茂超详细)

使用 Docker 部署 RabbitMQ 是一种简便而高效的方式，适合快速启动消息队列服务。首先，用户需要从 Docker Hub 拉取 RabbitMQ 的官方镜像，该镜像通常带有管理控制台的版本。接着，通过命令行启动容器，可以自定义端口映射、配置文件路径等参数。RabbitMQ 容器在 Doc

overfit同步小助手 2024-09-26 13:03:57 0 收藏

【Kafka】怎么解决Kafka消费者消费堆积问题？

本文针对Kafka消费堆积问题，分析了原因，并提供了重制消费点位、增加消费者数量、优化消费能力等解决方案。以Java为例，给出了相应的代码示例。在实际应用中，应根据具体情况选择合适的解决方案，并注意监控和调整，以确保Kafka系统的稳定性和性能。

overfit同步小助手 2024-09-26 13:03:16 0 收藏