大数据 - overfit.cn

kafkak集群的安装部署

1. 三台主机都需要安装好jdk2. 三台主机都要配置好zookeeper3. 准备好kafka压缩包二、kafka集群的安装1. 上传压缩包2. 解压3. 创建消息目录4.修改server.properties文件5. 分发 kafka安装目录6. 修改HadoopSlave01,HadoopSl

overfit同步小助手 2024-02-07 00:03:34 0 收藏

微服务架构+服务注册中心+Nacos和Eureka+比较分析

overfit同步小助手 2024-02-07 00:03:31 0 收藏

10款优秀的Kafka管理工具分享

它提供了全面的集群管理功能，包括主题和分区的创建、消费者组的监控和管理，以及实时的指标和日志分析。它提供了灵活的数据模型和强大的查询语言，可以帮助您收集、存储和分析Kafka集群的指标数据。它提供了一个直观的用户界面，可以让您轻松地查看主题、分区和消费者组的状态，创建和修改主题，以及监控消息的生产和

overfit同步小助手 2024-02-06 23:03:36 0 收藏

jdk+zookeeper+kafka 搭建kafka集群

环境资源包：jdk-8u341-linux-x64.tar.gzkafka_2.12-2.2.0.tgzzookeeper-3.4.14.tar.gz因为kafka需要Java环境，所以优先配置jdk环境，若已经配置了java环境，此步骤可以忽略二、zookeeper集群安装二、kafka集群安装至

overfit同步小助手 2024-02-06 21:03:51 0 收藏

zookeeper：启动后占用8080端口问题解决

我们经常在运行zookeeper服务时，不需要配置服务端口，服务默认会使用8080端口。若此端口与系统其他服务冲突，就需要手动变更zookeeper的服务端口。修改端口的方法是，打开配置文件zoo.cfg，在文件末行添加以下内容。# admin.serverPort 默认占8080端口。

overfit同步小助手 2024-02-06 21:03:35 0 收藏

大数据为智能家居带来的汽车变革

1.背景介绍随着互联网的普及和人工智能技术的发展，智能家居已经成为了人们生活中不可或缺的一部分。智能家居通过将传感器、摄像头、微控制器等设备与互联网联网，实现了家居设施的智能化管理和控制。这种智能家居的发展为多个行业带来了深远的影响，尤其是汽车行业。在这篇文章中，我们将探讨大数据如何为智能家居带来汽

overfit同步小助手 2024-02-06 18:03:50 0 收藏

RabbitMQ（一）

安全选RocketMQ，高吞吐选kafka，对这两个方面没有那么高的话就选RabbitMQ。

overfit同步小助手 2024-02-06 18:03:46 0 收藏

大数据 - Spark系列《一》- 从Hadoop到Spark：大数据计算引擎的演进

通过本文，您将了解到Hadoop与Spark的基础知识，并掌握Spark编程的基本流程和实践经验。

overfit同步小助手 2024-02-06 18:03:37 0 收藏

centos7安装erlang23.3.4.11及rabbitmq3.9.16版本

rpm包有系统版本要求，el是Red Hat Enterprise Linux(EL)的缩写。所以我们在安装erlang及rabbitmq时需要选择与自己的服务器相对应的rpm包。EL8是Red Hat 8.x, Centos 8.x。EL7是Red Hat 7.x，Centos 7.x。# 查看e

overfit同步小助手 2024-02-06 17:03:46 0 收藏

SpringBoot整合Dubbo和Zookeeper分布式服务框架使用的入门项目实例

Dubbo和Zookeeper分布式服务框架使用的入门项目实例

overfit同步小助手 2024-02-06 17:03:24 0 收藏

Kafka(二）原理详解

在Kafka集群中会有一个或者多个broker，其中有一个broker会被选举为控制器（Kafka Controller），它负责管理整个集群中所有分区和副本的状态。：leader副本出现故障时，选举新的leder；检测到某个分区的ISR发生变化时，通知所有borker更新元数据；分区数量发生变化时

overfit同步小助手 2024-02-06 16:03:36 0 收藏

HBase性能优化：HBase性能的监控与优化

1.背景介绍1. 背景介绍HBase是一个分布式、可扩展、高性能的列式存储系统，基于Google的Bigtable设计。它是Hadoop生态系统的一部分，可以与HDFS、MapReduce、ZooKeeper等组件集成。HBase具有高可靠性、高性能和易用性，适用于大规模数据存储和实时数据处理。随着

overfit同步小助手 2024-02-06 16:03:31 0 收藏

Flink vs. Spark：特点、区别和使用场景

Flink 和 Spark 都是强大的大数据处理框架，各自有着独特的特点和适用场景。通过本文的比较，可以更深入地了解它们，并根据自身需求选择适合的框架来处理数据。掌握两者的优劣势有助于更好地应用于大数据处理和实时计算场景。

overfit同步小助手 2024-02-06 15:03:53 0 收藏

【分布式技术】消息队列Kafka

主要原因是由于在高并发环境下，同步请求来不及处理，请求往往会发生阻塞。比如大量的请求并发访问数据库，导致行锁表锁，最后请求线程会堆积过多，从而触发 too many connection 错误，引发雪崩效应。我们使用消息队列，通过异步处理请求，从而缓解系统的压力。消息队列常应用于异步处理，流量削峰，

overfit同步小助手 2024-02-06 15:03:27 0 收藏

Spark六：Spark 底层执行原理SparkContext、DAG、TaskScheduler

学习Spark运行流程

overfit同步小助手 2024-02-06 14:03:46 0 收藏

Hadoop与Spark横向比较【大数据扫盲】

例如，对于非常大的数据集，如果超过了 Spark 可以缓存的内存大小，Spark 可能需要频繁地将数据换出到磁盘，这会降低其性能。但由于 Spark 的内存计算特性，如果节点失败，可能需要从头开始重新计算，而 Hadoop 的 MapReduce 由于每个阶段的结果都保存在磁盘中，因此可能更能容忍节

overfit同步小助手 2024-02-06 14:03:29 0 收藏

大数据 Yarn - 资源调度框架

所谓高层模块和低层模块的划分，简单说来就是在调用链上，处于前面的是高层，后面的是低层。我们以典型的Java Web应用举例，用户请求在到达服务器以后，最先处理用户请求的是Java Web容器，比如Tomcat、Jetty这些，通过监听80端口，把HTTP二进制流封装成Request对象；然后是Spr

overfit同步小助手 2024-02-06 13:03:18 0 收藏

大数据概念与术语简介

大数据是一个总称，用于描述从大型数据集中收集、组织、处理和获取见解所需的非传统策略和技术。虽然处理超出单台计算机的计算能力或存储容量的数据并不是一个新问题，但近年来，这种类型的计算的普及性、规模和价值大大扩展。在本文中，我们将从基本层面讨论大数据，并定义您在研究该主题时可能遇到的常见概念。我们还将高

overfit同步小助手 2024-02-06 13:03:10 0 收藏

物理系统的计算能力：如何应对大数据挑战

1.背景介绍大数据是当今世界面临的一个重大挑战，它需要我们设计高效、高性能的计算系统来处理和分析。物理系统的计算能力在这个领域发挥着关键作用。本文将探讨如何利用物理系统的计算能力来应对大数据挑战，包括背景介绍、核心概念与联系、核心算法原理和具体操作步骤以及数学模型公式详细讲解、具体代码实例和详细解释

overfit同步小助手 2024-02-06 12:03:52 0 收藏

MyBatis与ApacheHive集成

1.背景介绍MyBatis与ApacheHive集成1. 背景介绍MyBatis是一款优秀的持久层框架，它可以使得开发者更加简单地操作数据库，同时提供了高效的数据访问能力。Apache Hive 是一个基于Hadoop的数据仓库工具，它可以处理大规模的数据存储和查询。在现代数据科学和大数据领域，My

overfit同步小助手 2024-02-06 12:03:48 0 收藏