SSD可靠吗?

 

我有罪,我杀死了6块SSD!...



作者:蛋蛋
我有罪,我杀死了6块SSD!

想要和蛋蛋还有全世界的大牛讨论SSD及存储相关技术?加nanoarch为微信好友,拉你进ssdfans微信群 。

‍欢迎给ssdfans投稿,投稿就能加入ssdfans作者群,和冬瓜哥,蛋蛋等大咖切磋武艺。

尽管SSD越来越普及,大有取代HDD之势,但在很多普通消费者心中,对SSD的可靠性总存有顾虑,特别是随着闪存工艺的进步,闪存颗粒耐久性一路下滑,更加深了用户的担忧。之前,我们有从技术角度上讨论过SSD的可靠性。如果看了以后,还是让你不能放心使用SSD,那么今天,我们从实际的SSD耐久性测试实验,来看看SSD是不是真的可靠。

消费级SSD可靠性究竟如何?18个月之前,TechReport就决心找出一个答案,对6块测试SSD开始了前所未有的折磨。一年半过去了,测试终于结束,一切都有了结果。今天,小编就给大家带来TechReport18个月耐久性实验的一个回顾与总结。

以下是译文,如果你英文足够好的话,你可以参看原文:http://techreport.com/review/27909/the-ssd-endurance-experiment-theyre-all-dead

下面有请Geoff Gasior:

大家好,我叫Geoff Gasior。

我有罪,我杀死了6块SSD,它们是一块海盗船 Neutron GTX 240GB, 一块因特尔 335 Series 240GB, 两块金士顿HyperX 3K 240GB(一块进行可压缩数据测试,一块进行不可压缩数据测试), 一块 840 Series 250GB 和一块 840 Pro 256GB。



18个月前,我就决定杀死他们。不是激情或者愤怒犯罪,不是以上帝的名义,也不是以国家的名义,更不是自卫,我杀死他们,仅仅只想看着他们慢慢死去。

我是个虐待狂,我没有给他们一个痛快,相反,我是慢慢的把他们折磨死的。我持续不断的往这些SSD体内写入数据,不像普通的SSD使用者那么仁慈,我写入的据量远远超过他们。我不仅折磨他们,我还把折磨他们的整个过程在线记录下来,让大家一起欣赏他们受虐的过程。我承认,我的确有点变态。

今天,在通往2.5PB的路上,最后两位幸存者也被我杀了。终于都死了,恩,今天是个伟大日子。

是时候悼念这些冤魂了。

以后不会再有对你们残杀记录了,我发誓今天是最后一篇,安息吧!

第一件需要提到的事情就是,所有的SSD都通过百TB大关。在写入上百TB数据后,它们都安然无恙,仍然健康快乐的活着。这是一件了不起的事情,要知道,这远远超过它们所期待的写入量,拿Intel的SSD来说,官方的最大写入量是22TB。

在写入200TB数据时,首先出现问题的是三星840,我们观察到了坏块的出现,其他SSD还是跑得挺欢。情理之中,因为840 SSD用的是TLC,而其他SSD是MLC。尽管如此,840 SSD还能继续工作,皮毛伤而已。

在写入300TB数据后,840真正遇到了问题,它出现不可纠数据错误。不可纠数据的出现,意味着数据的丢失,这严重影响到数据的完整性和系统的稳定性。所以在实际使用中,我们建议停止继续使用。不过,它不影响我们的测试。300TB数据写入后,除了840 SSD出现上述问题,其他SSD都没有出现任何问题!

尽管840在200TB写入量就出现问题,但真正死亡是在写入将近1PB数据后。



令人大跌眼镜的是,尽管是TLC,840并不是是所有测试SSD中死得最早的一个,也不是第二个。死的最早的是金士顿HyperX 3K (不可压缩测试),然后是Intel SSD 335。

金士顿HyperX 3K (不可压缩测试)是在写入728TB的时候死掉了。



在写入600TB之前,金士顿HyperX 3K表现很好,没有出现任何错误。但过了600TB门槛后,各种毛病都出现了。下面是其错误趋势:



Intel SSD 335是在写入750TB数据后死了的。写入量同样达到700TB的时候,SMART信息就发出了失败警告,但是使用起来仍然一切正常,闪存单元也几乎都是完整的,只有一个重分配扇区,还是写入300TB时候出现的。于是继续写入,但仅仅只过了50TB,也就是到达750TB,最终就崩溃了。



840后死亡的是海盗船。1.1PB之前,海盗船一直表现稳健,没有任何错误,没有任何性能下滑 (事实上性能反而在持续缓慢上升,实在难以理解)。但在随后的100TB测试中,坏块急剧增加,出现大量的警告信息。但在写入1.2PB数据后,它还能工作。它的死亡是在一次重启后,就检测不到。



最后两位斗士是840 PRO和金士顿HyperX 3K(可压缩数据测试,得益于Sandforce具有数据压缩功能的controller)。

我们测试了两块HyperX 3K,一块用可压缩数据,一块测试不可压缩数据。



HyperX 3K采用的是Sandforce控制器,带有实时数据压缩功能,对可压缩数据,它写入FLASH的数据会比HOST写入的数据量少。



从上图可以看出,对不可压缩数据,真正写到Flash的数据比Host写入还稍微多一点,而对可压缩数据,真正写入到Flash的数据大概是Host写入的72%左右。

记得它兄弟(不可压缩测试)在写入728TB的时候就死了,对可压缩Hyper X来说,对应Host写入1.1PB左右。但是,它还多写了1PB左右的数据才牺牲。



与之前用于不可压缩数据测试的Hyper X的相比,它是在写入900TB数据后开始出现问题,而之前的在写入600TB数据就开始出现问题。为什么本是同根生,寿命却迥异?

唯一能解释的是,可压缩的flash比不可压缩的flash运气好点,质量好点。

最后牺牲的是840 Pro。



840 PRO是所有SSD中表现最完美的,直到死亡,我们都没有看到数据有不可纠错误,而且它的坏块出现平稳增长(没有在某个节点突然暴增)。



坏块在写入600TB后才出现,此后数量稳定增加。最后在写入2.4PB数据后,坏块超过7000个。



下面看看这些SSD在整个测试过程中性能表现。



4MB顺序读取:除了海盗船在后期有明显跳跃,其他SSD性能都比较稳定。



4MB顺序写入: 840 Pro在这个过程中有一定跳动,其他都保持稳定。



4KB随机读取:Intel, Kingston的SSD在写入100TB的时候,性能不降反升,性能最好。其后也有些抖动。其他SSD性能稳定。



4KB随机写入:所有SSD都没有明显波动

值得一提的是,从上面性能指标来看,840 PRO始终保持领先。

总的来看,所有的SSD在测试过程中,各项性能都算平稳,没有发生大的下降。

写在最后:


这个SSD耐久性实验持续了18个月,是目前持续时间最长的SSD测试。虽然过程漫长,但结果是令人欣喜的。虽然我们只测试了6块SSD,样本有点小,但管中窥豹,我们仍然可以说,SSD并不是人们想象的那么不可靠,相反,它们完全能胜任日常使用,即使是TLC的840,也完全能满足使用需求。并且,这些SSD在使用过程中,性能并没有发生明显的下降。所以,对于消费者而言,完全可以放心的使用SSD。SSD的寿命问题根本就不是问题!

不想错过蛋蛋的后续精彩文章?长按或扫描下面二维码关注ssdfans就可以了!


    关注 ssdfans


微信扫一扫关注公众号

0 个评论

要回复文章请先登录注册