hbase - overfit.cn

【基于HBase和ElasticSearch构建大数据实时检索项目】

13. 构建maven工程，配置settings.xml（可配置阿里或华为maven仓库），如下所示：添加依赖到pom.xml中，如下所示：新建data目录，并将测试数据放在该目录下，如下图所示：添加各类配置文件，如conf.properties、application.properties、log

overfit同步小助手 2023-09-20 16:03:57 0 收藏

大数据——一文熟悉HBase

HBase是基于HDFS的数据存储，它建立在HDFS文件系统上面，利用了HDFS的容错能力，内部还有哈希表并利用索引，可以快速对HDFS上的数据进行随时读写功能。Hadoop在已经有一个Hive+MapReduce结构的数据读写功能，为什么还要HBase呢？我们在使用Hive的过程中也发现，MapR

overfit同步小助手 2023-09-20 11:04:06 0 收藏

HBase入门(一)

HBase是一种分布式、可扩展、支持海量数据存储的NoSQL数据库。

overfit同步小助手 2023-09-19 09:04:39 0 收藏

Kerberos安全认证-连载11-HBase Kerberos安全配置及访问

技术连载系列，前面内容请参考前面连载10内容:大数据组件HBase也可以通过Kerberos进行安全认证，由于HBase中需要zookeeper进行元数据管理、主节点选举、故障恢复，所以这里对HBase进行Kerberos安全认证时，建议也对Zookeeper进行安全认证

overfit同步小助手 2023-09-14 12:03:33 0 收藏

大数据之Hadoop分布式数据仓库HBase

HBase 是一个构建在 Hadoop 文件系统之上的面向列的数据库管理系统。HBase 是一种类似于 Google’s Big Table 的数据模型，它是 Hadoop 生态系统的一部分，它将数据存储在 HDFS 上，客户端可以通过 HBase 实现对 HDFS 上数据的随机访问。不支持复杂的事

overfit同步小助手 2023-09-14 08:04:09 0 收藏

【FusionInsight 迁移】HBase从C50迁移到6.5.1（01）迁移概述

项目上最近全新部署了FusionInsight HD 6.5.1大数据集群，并且希望将老集群FusinInsight HD C50的所有业务都迁移到新集群上。由于在老集群C50上的HDFS、HBase中存在有大量的业务数据，因此将业务从C50迁移到6.5.1的过程中，就需要将C50上的业务数据同步迁

overfit同步小助手 2023-09-14 08:03:57 0 收藏

Hadoop Hbase Hive 版本对照一览

Hadoop Hbase Hive 版本对照，官网查询记录，仅供参考。

overfit同步小助手 2023-09-10 21:03:54 0 收藏

1. HBase中文学习手册之揭开HBase的神秘面纱

HBase基础入门第一课

overfit同步小助手 2023-09-10 09:03:57 0 收藏

jdbc集成phoneix hbase

【代码】jdbc集成phoneix hbase。

overfit同步小助手 2023-09-08 13:04:24 0 收藏

Python使用happybase写入HBase

本文介绍如何使用Python的happybase模块和gdal模块，从tif格式的影像文件中读取数据，并将其存储到HBase数据库中。

overfit同步小助手 2023-09-07 18:03:55 0 收藏

Hbase drop 表卡住没有响应

在 Master UI 主页的 Procedures & Locks 菜单栏下，在页面标题中列出了所有正在进行的 Procedure 和 Locks，以及当前的 Master Procedure WALs；Procedure 和 Locks 的列表也可以通过 hbase shell 获得: list

overfit同步小助手 2023-09-03 11:04:18 0 收藏

HBase JMX 指标学习

overfit同步小助手 2023-09-02 21:04:18 0 收藏

HBase 2.3.7中snappy压缩配置

本文将介绍如何在HBase 2.3.7中配置snappy压缩。snappy是一种快速的数据压缩和解压缩算法，可以提高HBase的存储空间利用率和读写性能。本文使用了HBase 2.3.7版本，运行在三个Ubuntu系统的虚拟机中，分别作为master和slave节点。也可以使用其他版本的HBase和

overfit同步小助手 2023-09-02 19:04:01 0 收藏

Hbase基础(一)——安装与使用

Hbase是一个分布式的、面向列的开源数据库，有区别于传统的行式数据库(如Mysql等)，与Hive数据仓库相比，更适合实时存储数据场景，但是与传统的列式数据库相比，更适合键值对的数据存取或者有序的数据存取。Hbase的版本有很多，读者在下载Hbase的压缩包之前，先去Hbase官网查看不同版本的h

overfit同步小助手 2023-09-01 16:04:34 0 收藏

Hbase-面试题

自动切分，默认情况下 2.0版本，第一次region的数据达到256M，会进行切分，以后就是每达到10G切分一次，切分完成后，会进行负载均衡，均衡到其他regionserver 预分区+自定义rowkey 可以理解为预切分比如预分区，每个regionserver会有10个region，每个re

overfit同步小助手 2023-09-01 07:03:46 0 收藏

Hbase-热点问题（数据存储倾斜问题）

某一台regionserver消耗过多，承受过多的并发量，时间长机器性能下降，甚至宕机。

overfit同步小助手 2023-08-30 01:04:17 0 收藏

Python 3 使用HBase 总结

Happybase是Python通过Thrift访问HBase的库，实现起来方便、快捷。造成此类问题的原因是：使用HBase 自带ZooKeeper 分布式调度框架造成，由于我的环境是单机版本，我的大致设置是使用独立ZooKeeper 服务。如下是我hbase-site.xml 和hbase-env

overfit同步小助手 2023-08-22 01:04:17 0 收藏

Windows下安装HBase

HBase（Hadoop Database），是一个高可靠性、高性能、面向列、可伸缩的分布式存储系统。利用HBase技术可在廉价PC Server上搭建起大规模结构化存储集群。

overfit同步小助手 2023-08-20 14:04:13 0 收藏

HBase（8）：扫描操作

在HBase，我们可以使用scan命令来扫描HBase中的表。[‘C1:STATUS’, …]在Ruby中[]表示一个数组。只查询订单状态以及支付方式，并且只展示3条数据。查看ORDER_INFO表中所有的数据。注意：要避免scan一张大表！

overfit同步小助手 2023-08-18 18:04:47 0 收藏

Spark操作HBase的数据，实现列值的计算

本文将介绍如何使用Spark操作HBase的数据，实现列之间的计算，以特征值计算为例。主要内容如下：创建SparkSession和HBaseConfiguration对象。读取HBase表的数据，并转化成RDD。进行列式计算，得到特征值，并转化成RDD。写入HBase表的数据。验证HBase表的数据

overfit同步小助手 2023-08-10 12:04:26 0 收藏