大数据 - overfit.cn

数据分区与负载均衡：HBase数据分区和负载均衡

1.背景介绍在大规模分布式系统中，数据分区和负载均衡是实现高性能和高可用性的关键技术。HBase是一个分布式、可扩展的列式存储系统，它基于Google的Bigtable设计。在HBase中，数据分区和负载均衡是实现高性能和高可用性的关键技术。本文将讨论HBase数据分区和负载均衡的核心概念、算法原理

overfit同步小助手 2024-02-12 13:03:48 0 收藏

Kafka入门笔记(一) --kafka概述+kafka集群搭建

kafka概述+kafka 集群搭建

overfit同步小助手 2024-02-12 12:03:41 0 收藏

ZooKeeper 实战(四) Curator Watch事件监听

Curator 中提供了三种 Cache（Watcher）来监听不同节点变化类型：+ NodeCache：监听指定的节点。+ PathChildrenCache：监听指定节点的子节点。+ TreeCache：监听指定节点及其子孙节点。

overfit同步小助手 2024-02-12 11:03:58 0 收藏

大数据 - Spark系列《三》- 加载各种数据源创建RDD

本篇博客将介绍如何在 Spark 中加载不同类型的数据源，介绍加载本地文件、本地集合以及 MySQL 数据库的过程。

overfit同步小助手 2024-02-12 11:03:43 0 收藏

HBase与NoSQL：HBase与其他NoSQL数据库的比较

1.背景介绍1. 背景介绍NoSQL数据库是一种非关系型数据库，它的特点是可以存储非结构化的数据，并且可以处理大量的数据。HBase是一个分布式、可扩展的列式存储系统，它是基于Google的Bigtable设计的。HBase是一个开源的NoSQL数据库，它的核心功能是提供高性能的随机读写访问。在本文

overfit同步小助手 2024-02-12 11:03:28 0 收藏

RabbitMQ下载与安装

我们在Centos7虚拟机中使用Docker来安装。

overfit同步小助手 2024-02-12 09:03:57 0 收藏

Hive 数仓及数仓设计方案

overfit同步小助手 2024-02-12 09:03:29 0 收藏

DBeaver连接hive

2.编辑驱动，驱动的jar包从安装的hive下的jdbc路径下获取，例如：/usr/local/hive/apache-hive-3.1.3-bin/jdbc/hive-jdbc-3.1.3-standalone.jar，然后添加到驱动处。其中主机填写hive所在节点地址，端口10000为默认，数据

overfit同步小助手 2024-02-12 08:03:56 0 收藏

hadoop3.3.4安装及启动

输入vi /etc/sysconfig/network-scripts/ifcfg-ens33(ens33是刚刚用ip addr查到的号码)，按i进入编辑模式，给机器分配ip地址，要与在ipv4中设置的ip地址不同，我这里写的是200.编辑完成后按esc退出，按下:wq保存修改。输入cd /home

overfit同步小助手 2024-02-12 08:03:41 0 收藏

数据查询与扫描：HBase数据的查询与扫描

1.背景介绍在大数据时代，HBase作为一个高性能、可扩展的列式存储系统，已经成为了许多企业和组织的核心数据存储和管理解决方案。HBase的查询和扫描功能是其核心特性之一，它们为用户提供了快速、高效的数据访问方式。在本文中，我们将深入探讨HBase数据的查询与扫描，揭示其核心概念、算法原理、最佳实践

overfit同步小助手 2024-02-12 07:03:43 0 收藏

【RabbitMQ】RabbitMQ面试热点

Server：又称为broker，接受客户端连接，RabbitMQ 节点；Connection：连接，应用程序与brokder建立网络连接;channel：网络通道，几乎所有的操作都是在channel中进行的，是进行消息对象的通道，客户端可以建立多个通道，每一个channel表示一个会话任务Vir

overfit同步小助手 2024-02-12 07:03:33 0 收藏

Zookeeper架构系列——集群模式

overfit同步小助手 2024-02-12 07:03:26 0 收藏

整合RabbitMQ实现消息异步发送

消息队列中间件消息队列中间件是分布式系统中重要的组件，主要解决应用耦合，异步消息，流量削峰等问题。中间件最标准的用法是生产者生产消息传送到队列，消费者从队列中拿取消息并处理，生产者不用关心是谁来消费，消费者不用关心谁在生产消息，从而达到解耦的目的。在分布式的系统中，消息队列也会被用在很多其它的方面，

overfit同步小助手 2024-02-12 06:03:55 0 收藏

Hadoop 原理及架构详解

主要介绍了 Hadoop 的相关操作与组件架构。

overfit同步小助手 2024-02-12 05:03:27 0 收藏

Zookeeper的数据版本控制与回滚

1.背景介绍Zookeeper是一个开源的分布式协同服务框架，用于构建分布式应用程序。它提供了一种可靠的、高性能的数据存储和同步机制，以及一种分布式协调服务。Zookeeper的数据版本控制和回滚功能是其核心特性之一，可以确保数据的一致性和可靠性。在分布式系统中，数据版本控制和回滚是非常重要的，因为

overfit同步小助手 2024-02-12 04:03:42 0 收藏

【Flink】基于Docker下的Flink运行环境搭建（Mac)

创建一个本地运行环境是提高开发效率和便捷进行代码调试的关键。我们将一起构建一个本地环境，专门用于执行Flink任务。此环境以Flink 1.17.2版本为基础，采用Docker技术搭建而成。通过这种方式，我们能够模拟出一个接近实际生产环境的运行条件，帮助我们更好地测试和优化我们的Flink应用。

overfit同步小助手 2024-02-12 03:03:46 0 收藏

2023年全国大数据职业技能大赛！！！想要更多资料私信我哦

ssh-keygen -t rsa 然后连续按下三次回车然后输入命令(若遇到需要输入yes或者no 输入yes) ssh-copy-id master 按下回车后输入master所对应的虚拟机密码 ssh-copy-id slave1 按下回车后输入slave1所对应的虚拟机密码 ssh-copy-

overfit同步小助手 2024-02-12 01:03:55 0 收藏

Flink检查点（checkpoint）、保存点（savepoint）的区别和联系122

<a href="https://m.weishi.qq.com/vise/share/index.html?id=7OLnIqNmC1Rx4LnIw&cg=awa">https://m.weishi.qq.com/vise/share/index.html?id=7OLnIqNmC1Rx4LnIw

overfit同步小助手 2024-02-12 01:03:48 0 收藏

基于国产服务器使用hive -testbench-hdp3工具测试hive的TPCDS

基于hive -testbench-hdp3测试hive的TPC-DS数据，通过调整、设置。按照步骤能够成功完成测试，并将结果进行展示。

overfit同步小助手 2024-02-12 01:03:36 0 收藏

数据流的存储与管理：构建高效的数据仓库

1.背景介绍数据仓库是现代企业和组织中不可或缺的一部分，它们需要有效地存储、管理和分析大量的数据。随着数据的增长和复杂性，构建高效的数据仓库变得越来越重要。在这篇文章中，我们将讨论数据流的存储和管理，以及如何构建高效的数据仓库。数据仓库的核心目标是提供一个集中的数据存储和管理平台，以便组织可以更有效

overfit同步小助手 2024-02-12 00:03:56 0 收藏