华为终结SSD大盘数据重构难题:能雕花、会自愈
创始人
2024-08-20 03:40:43

快科技8月19日消息,在通常的分布式存储中,当系统检测到硬盘故障时,系统会采用EC(Erasure Coding)纠删码等冗余校验手段,利用其余节点上的正常硬盘、正常数据,在后台跨节点地将整块硬盘的故障数据重构出来。

然而,随着SSD容量逐步增大,大盘需要重构的数据量翻了4~8倍、耗费时长也等比例上升。

在这个漫长的重构周期里,不仅挤占25%存储带宽、影响业务性能,且更致命的是,系统将处于可靠性降级状态,数据将会面临随时丢失。

今天,华为介绍了全闪分布式存储,对SSD的故障域实施局部隔离,尽可能避免原先的大范围的整盘重构。

针对盘内DDR的失效,华为创新地采用TRR(Tiny Region Reconstruction,最小范围重构)算法,通过盘控深度配合,精准识别并上报失效区域所映射的逻辑地址,然后通知存储系统,对受影响的局部数据进行屏蔽。

这个过程,就像在硬盘上“精密镂刻”一样,然后在新的位置精准重构出这一小部分数据。这,就避免了过去动辄整盘重构,让其余正常数据“免遭牵连”,减少了数百倍的重构数据量,整个过程几分钟就能搞定。

针对NAND Flash的失效,华为也采用自研的“盘内RAID算法”,对盘上所有数据以Die为单位,建立RAID组冗余校验。我们将故障范围精准缩小到Die级,利用其余正常的Die、通过盘内计算引擎恢复出正确的数据。

这项技术的厉害之处在于,这个过程可以不断重复,允许Die一个接一个地失效,持续缩列、甚至缩容而不丢失任何数据。这个操作完全发生在SSD盘内,上层存储系统那个“大佬”根本无需插手,完全不知道底下这么热闹。

假如遇上多个Die同时失效、或者整个颗粒失效的极端情况,那SSD单盘就兜不住了,但系统自然也有备而来。存储系统会立刻启动TRR算法,进行局部数据的“镂刻”和“填坑”,做到精准屏蔽、并进行计划性预拷贝重构。

⚠️
本网站信息内容及素材来源于网络采集或用户发布,如涉及侵权,请及时联系我们,发送链接至2697952338@QQ.COM,我们将第一时间进行核实与删除处理。

相关内容

热门资讯

全球轮胎巨头米其林:百年品牌引... 一、公司概况米其林集团(Michelin SCA,股票代码:ML.FP)成立于1889年,总部位于法...
Fortinet:以安全与网络... 一、公司概况Fortinet(飞塔公司,NASDAQ代码:FTNT)成立于2000年,由清华大学校友...
泰克资源(Teck Resou... 一、公司概况泰克资源有限公司(Teck Resources Limited,TSX: TECK.A ...
全球光伏功率优化龙头:Sola... 一、公司概况SolarEdge Technologies, Inc.(纳斯达克股票代码:SEDG)成...
视觉灵感经济巨头:Pinter... 一、公司概况Pinterest, Inc.(股票代码:PINS)成立于2009年3月,总部位于美国加...
PUMA SE(彪马):全球运... 一、公司概况PUMA SE(彪马股份公司)是一家总部位于德国巴伐利亚州黑措根奥拉赫(Herzogen...
Databricks Inc.... 一、公司概况Databricks Inc.成立于2013年,总部位于美国加利福尼亚州旧金山,是全球企...
Cloudflare, Inc... 一、公司概况Cloudflare, Inc.(股票代码:NET)成立于2009年7月,总部位于美国加...
小鹏汽车:智能电动汽车赛道的创... 一、公司概况小鹏汽车(XPeng Inc.,股票代码:XPEV)成立于2014年,是中国领先的智能电...
携程集团(Trip.com G... 一、公司概况携程集团(Trip.com Group Limited,纳斯达克:TCOM,港交所:99...