埃尔法哥哥■深入HBase读写( 二 ) 在了解HBase架构的基础上

而对于hbase服务端来说，当一个Get请求过来后，还是会转换为一个特殊的scan请求，即startrow和endrow一致的Scan请求。所以，下文的介绍，就围绕scan展开。
首先，我们要知道， HBase的写入很快，是追加多版本的形式，删除也很快，只是插入一条打上“deteled”标签的数据。因此， hbase的读操作比较复杂的，需要处理各种状态和关系。
因为Store是按照columfamily来划分的，一张表由N个列族组成，就有N个StoreScanner负责该列族的数据扫描。
当client要查询一个region ，那么就会有一个RegionScanne ，这个regionscannerr会创建N个StoreScanner 。
而一个store由多个storefile和一个memstore组成，
因此， StoreScanner对象会创建一个MemStoreScanner和多个StoreFileScanner进行实际数据的读取。
这些scanner首先根据TimeRange和RowKeyRange过滤掉一部分肯定无用的StoreFileScanner 。
剩下的scanner组成一个最小堆KeyValueHeap 。这个最小堆的实际数据结构是一个优先级队列，队列中所有元素是scanner ，根据scanner指向的keyvalue进行排序(scanner类似游标，每次查询一个结果后，通过next下移找下一个kv值) 。
举个简单的例子。

文章图片
假设有4个scanner组成的优先级队列，分布标记为ScannerABCD 。
1）查询的时候首先pop出heap的堆顶元素。
2）第一次pop出来的是scannerA 。调用next请求，将会返回ScannerA中的rowA:cf:colA ，而后ScannerA的指针移动到下一个KeyValuerowA:cf:colB；
3）重新组织堆中元素，堆中的Scanners排序不变；
4）第二次pop出来的还是scannerA 。调用next请求，返回ScannerA中的rowA:cf:colB ， ScannerA的current指针移动到下一个KeyValuerowB:cf:ColA；
5）重新组织堆中元素，由于此时scannerA的指针指向了rowB ，按照KeyValue排序可知rowB小于rowA,所以堆内部， scanner顺序发生改变，改变之后如下图所示：
6）第三次pop出来的就是ScannerB了。
以此类推。

文章图片
当某个scanner内部数据完全检索之后会就会被close掉，或者rowA所有数据检索完毕，则查询下一条。
【埃尔法哥哥■深入HBase读写】默认情况下返回的数据需要经过ScanQueryMatcher过滤返回的数据需要满足下面的条件：
该KeyValue不是已经删除的数据（KeyType不是Deleted/DeletedCol等）如果是就直接忽略该列所有其他版本，跳到下个列族；
该KeyValue的Timestamp是在用户设定的TimestampRange范围内
该KeyValue满足用户设置的各种filter过滤器
该KeyValue满足用户查询中设定的版本数，比如用户只查询最新版本，则忽略该cell的其他版本；反正如果用户查询所有版本，则还需要查询该cell的其他版本。
至此，就是HBase大致上的读写流程。
我们经常听说HBase数据读取要读Memstore、HFile和Blockcache ，为什么我们这里说Scanner只有StoreFileScanner和MemstoreScanner ，而没有BlockcacheScanner呢?
因为HBase中数据仅独立地存在于Memstore和StoreFile中， Blockcache作为读缓存，里面有StoreFile中的部分热点数据，因此，如果有数据存在于Blockcache中，那么这些数据必然存在StoreFile中。因此使用MemstoreScanner和StoreFileScanner就可以覆盖到所有数据。
而在实际的读操作时， StoreFileScanner通过索引定位到待查找key所在的block之后，会先去查看该block是否存在于Blockcache中，如果存在，那么就会去BlockCache中取出，避免IO ，如果BlockCache中不存在，才会再到对应的StoreFile中读取。

埃尔法哥哥■深入HBase读写( 二 )

推荐阅读

央视新闻客户端|北京纪事｜三张面孔——看北京如何控制了疫情

制作|武侠小说中的“鹤顶红”, 和砒霜比起来谁更毒? 是用何物制作的?

徐静营养师：菌菇的食用价值

「起亚汽车」起亚智跑，性价比最高的紧凑型SUV，这个价格哈弗H6都眼红

选车中心|为啥摄像头总要闪一下？，开车经过路口

全球变暖|太平洋海温正在降低，拉尼娜或已确定，地球将迎来寒冬期！

奔腾B70|再等17天就上市！和雅阁同级，爆169马力，不足11万迷倒一片！

春和景丽|《孔雀东南飞》:再美好的婚姻都会毁在多事婆婆手上

「型男笔记」Air Force Max，能否代替雨鞋？，Nike

三件|第三十届中国人大新闻奖揭晓人民网三件作品获奖

人数攀升！斯里兰卡爆炸已致125死，160人受伤

2020世界杯在哪举行个城市 2020世界杯在哪举行

自卑导致的社交能力差怎样克服

冬瓜|看老公大显身手冬瓜烧肉不难做

豆瓣@“以为是烂片，结果被打脸”的五部电影：你若都看过，大佬无疑！

二十五岁的男生应有那些品质

如何挑选优质的电卷棒

[创作者来直播]国联股份多多电商首播带货：订单超2.3亿元！观众达5.1万次

特斯拉|当特斯拉的屠刀真实落下

结晶|[路演]诚益通：美国项目CBD结晶产品已开始实验生产