微服务和高并发:随着传统开发逐渐转向微服务架构,面向"老百姓"的应用需要处理的并发量急剧增加。在这种高并发环境下,传统关系型数据库在增删改查操作上的速度往往跟不上项目的需求。
传统开发解决高并发的策略:
- ① 将数据库中的数据定期存储到Redis中,后端查询操作直接面向Redis来执行。
- ② 构建数据库的Redis的集群化。
引入HBase的原因:当Redis的存储能力不足或主从结构过于复杂导致效率下降,Hbase成为一个优秀的选择。HBase以其【快速的读写速度】和【高吞吐量】,能够有效且快速地处理大数据的增删改查操作。
HBase特点:
① 高吞吐量的读写操作
为什么HBase有快速的读写速度(高吞吐量)?
写操作:
内存写入:所有的写操作首先被写入到MemStore中,这一操作是在内存中完成的,高效。并且对于HBase而言,只要数据写入MemStore存储区就标志着写操作已经完成,无需等待落盘。
数据备份:在数据刷新到磁盘之前,所有的写操作都会被记录在Hlog,即使故障,也能够恢复数据。
并行写操作:HBase的每个列族对应一个MemStore,能够对不同列族的数据进行并行处理。
如何理解"无需暂停写入操作以等待数据落盘"的设计理念?
MemStore提供了一种暂存数据的方式,直至数据被刷新到磁盘上的StoreFile中。
通过WAL机制保证MemStore在数据未落盘时发生故障也不会导致数据丢失。
保障数据一定能够落盘(即使数据丢失也可以通过HLog恢复数据),此时可以认为操作已经完成。
因此写入的数据得到保障后,允许系统在高吞吐量的情况下继续接受和处理新的写请求。
读操作:
读操作可以直接从内存中的MemStore或者是缓存中的BlockCache获取数据
使用Bloom Filter检查所需的数据是否不在StoreFile中,如果数据不在那里,能够及时终止读操作,避免了不必要的磁盘访问。
(为什么Bloom Filter能够实现快速检查的功能?BloomFilter的算法原理。)
② HBase天生支持集群部署,无需进行复杂的分表或者分库操作。简化了大规模数据处理的复杂性。
③ HBase是列式存储
列式存储和行式存储的理解
- 定义
- 列式存储是指每一列的数据存储在一起。
- 行式存储是指每一行的数据存储在一起。
- 列式存储的优势
- 高效的数据存储&#
版权归原作者 2401_84181125 所有, 如有侵权,请联系我们删除。