hbase - overfit.cn

记录「 Hbase的数据迁移与bulkload流程与实践」

hbase数据迁移，DistCp（分布式拷贝）是用于大规模集群内部和集群之间拷贝的工具。它使用Map/Reduce实现文件分发，错误处理和恢复，以及报告生成。它把文件和目录的列表作为map任务的输入，每个任务会完成源列表中部分文件的拷贝。我们知道MR程序适合用来处理大批量数据，其拷贝本质过程是启动

overfit同步小助手 2024-01-02 08:03:21 0 收藏

【大数据存储与处理】实验一 HBase 的基本操作

本实验介绍了Hbase的使用环境，要求掌握Hbase创建数据库表及删除数据库表，掌握Hbase对数据库表数据的增、删、改、查。注意区分hbaseshell命令和linux命令。

overfit同步小助手 2023-12-31 08:03:31 0 收藏

windows 安装部署pinpoint-2.3.3，实现springboot项目的链路追踪

javaagent:D:\pinpoint\pinpoint-agent-2.3.3\pinpoint-agent-2.3.3\pinpoint-bootstrap-2.3.3.jar #设置\pinpoint-agent-2.3.3目录下的pinpoint-bootstrap-2.3.3.jar

overfit同步小助手 2023-12-31 04:03:48 0 收藏

大数据 | 实验一：大数据系统基本实验 | 熟悉常用的HBase操作

1）理解 HBase 在 Hadoop 体系结构中的角色。2）熟练使用 HBase 操作常用的 shell 命令。3）熟悉 HBase 操作常用的 Java API。

overfit同步小助手 2023-12-29 00:03:27 0 收藏

【大数据】HBase 中的列和列族

HBase 的每一个行都是离散的，因为列族的存在，所以一个行里不同的列甚至被分配到了不同的服务器上。行的概念被减弱到了一个抽象的存在。在实体上，把多个列定义为一个行的关键词 RowKey，也就是行这个概念在 HBase 中的唯一体验。

overfit同步小助手 2023-12-27 16:03:19 0 收藏

大数据课程综合实验案例---课设问题汇总

大数据课设问题汇总

overfit同步小助手 2023-12-27 11:03:37 0 收藏

头歌——HBase 开发：使用Java操作HBase

overfit同步小助手 2023-12-27 10:03:54 0 收藏

Hadoop3.3.6安装和配置hbase-2.5.5-hadoop3x，zookeeper-3.8.3

/修改 zoo.cfg 配置文件，将 dataDir=/data/zookeeper/data 修改为指定的data目录。重点：以下配置都是在root用户下进行配置后续会给对应的hadoop用户权限。推荐一口气配置完在进行给予权限和进行配置文件的刷新，以及最后的分发。在安装过程中推荐设置root用户

overfit同步小助手 2023-12-27 06:03:16 0 收藏

phoenix安装以及启动过程中出现的报错

如果没有下载htrace-core-3.2.0-incubating.jar 包，将该包放到/opt/install/hbase-2.2.7/lib下面，hbase每一个节点都要放，然后重启hbase。解决办法：查看/opt/install/hbase-2.2.7/lib 下面是否有htrace-c

overfit同步小助手 2023-12-26 07:03:45 0 收藏

HBase之HBCK2

hbase集群修复工具

overfit同步小助手 2023-12-25 17:03:16 0 收藏

大数据存储技术（3）—— HBase分布式数据库及安装配置

HBase是Apache的Hadoop项目的子项目，是一个分布式的、面向列的开源数据库。本篇文章介绍HBase及其安装配置。

overfit同步小助手 2023-12-24 12:03:27 0 收藏

Hadoop3.x完全分布式环境搭建Zookeeper和Hbase

基于hadoop3.x完全分布式环境下部署zookeeper和Hbase注意事项：在启动Hbase之前要在所有集群节点上启动zookeeper 否则Hbase会报错（日志），无法使用。

overfit同步小助手 2023-12-22 20:03:47 0 收藏

HBaseAPI——IDEA操作HBase数据库&HBase与Hive的集成

HBaseAPI——IDEA操作HBase数据库&HBase与 Hive 的集成

overfit同步小助手 2023-12-22 18:03:45 0 收藏

启动Hbase出现报错

slave1:running regionserver, logging to /usr/local/hbase-2.3.1/bin/logs/hbase-wanggigi- regionserver-slave1.outslave1:/usr/local/hbase-2.3.1/bin/hbase

overfit同步小助手 2023-12-20 15:03:49 0 收藏

虚拟机安装hadoop，hbase（单机伪集群模式）

工作中遇到了大数据方面的一些技术栈，没有退路可言，只能去学习掌握它，就像当初做爬虫一样（虽然很简单），在数据爆发的现在，传统的数据库mysql，oracle显然在处理大数据量级的数据时显得力不从心，所以有些特定的业务需要引进能够处理大数据量的数据库，hadoop提供了分布式文件系统（HDFS）来存储

overfit同步小助手 2023-12-19 21:04:07 0 收藏

分布式数据库HBase

HBase是一个分布式的、面向列的开源数据库HBase是Google BigTable的开源实现HBase不同于一般的关系数据库, 适合非结构化数据存储HBase是一种分布式、可扩展、支持海量数据存储的 NoSQL数据库。HBase是依赖Hadoop的。为什么HBase能存储海量的数据？因为HBas

overfit同步小助手 2023-12-17 19:03:36 0 收藏

HBase高阶（一）基础架构及存储原理

HBase是Hadoop生态系统中的一个分布式、面向列的开源数据库，具有高可伸缩性、高性能和强大的数据处理能力。广泛应用于处理大规模数据集。HBase是一种稀疏的分布式持久的多维排序map稀疏：对比关系型数据库和非关系型数据库，关系型数据库是以表格的形式进行存储，对存储的要求较高，每一行每一列都需要

overfit同步小助手 2023-12-17 18:03:43 0 收藏

HBase Compaction 原理与线上调优实践

本文对 HBase Compaction 的原理、流程以及限流的策略进行了详细的介绍，列举了几个线上进行调优的案例，最后对 Compaction 的相关参数进行了总结。

overfit同步小助手 2023-12-15 22:03:52 0 收藏

HBase的RowKey详解、RowKey设计原则和RowKey优化方法

overfit同步小助手 2023-12-15 12:03:51 0 收藏

HBase架构和部署(超级详细)

在Memstore超过一定的阈值的时候，就要新开一个进程将Memstore flush到storefile中，新的Memstore继续写入接受到的数据，当storefile越来越多时，就会降低读的性能，为了提高读的性能，可以对这些storefile进行compact操作，形多个storefile合并

overfit同步小助手 2023-12-12 21:03:44 0 收藏