纳斯达克停市竟然是一场微小震动带来的?!

 

环境发生微小震动所带来的数据中心宕机并不是个案。...

一场微小震动引发的金融“血案


讲真,不是标题党。据知名英国科技新闻网站The Register报道,2018年4月18日,北欧纳斯达克交易停市到下午2点,原因是数据中心核心机房发生火警误告,引发高压气流灭火。瞬间产生的高压气体带来了巨大的啸叫噪音,引起机架长时间剧烈抖动,导致股票交易系统核心设备因震动损坏而瘫痪。虽然纳斯达克及时启用了位于瑞典Väsby的备份数据中心,但交易系统依然经历了长时间切换,到下午2点才恢复正常。
无独有偶,某国TOP运营商的“小确幸”


环境发生微小震动所带来的数据中心宕机并不是个案。The Register还提到,4年前的悉尼某对外运营的数据中心因同样的问题导致大面积设备损坏,引起租户大规模投诉;无独有偶,在去年12月,某发达国家运营商核心机房发生了同样的事情,大面积的设备损坏导致部分业务停了一周才恢复。

这个运营商的核心机房中,购置了包括华为在内的四家存储设备,华为提供了OceanStor Dorado V3的全闪存和OceanStor V3的混合闪存承载业务,共有468块全闪存硬盘和333块机械硬盘。事故发生后,华为设备468块SSD 0故障;333块NL-SAS盘仅4块需更换,而且所承担业务数据完好无损。对比一下同机房的其他三家厂商,存储设备都发生了大面积的机械硬盘甚至存储设备损坏,不仅造成了数据丢失,并且损坏严重的设备只能整机替换,这是导致部分业务停机一周的主要原因。
背后是“国家9级抗震认证”的权威保障
那么华为存储设备的表现,会有幸运的成分吗?当然不是。

华为在ICT领域已经有30年的耕耘,在设备防震上积累深厚。去年,华为全闪存存储通过了中国泰尔实验室(TTL)的“九级抗震证明”,是唯一通过泰尔实验室该项证明的IT产品系列。
中国泰尔实验室“九级抗震证明”的权威性
中国泰尔实验室(China Telecommunication Technology Labs)始于1981年9月21日,由原国家标准总局和原中华人民共和国邮电部联合批准成立。在中国,所有公共通信设备的入网许可办理前,必须通过中国泰尔实验室的性能测试;同时,中国泰尔实验室也是美国的FCC、欧盟的CE、加拿大的IC、日本的JATE、埃及的NTRA等国际准入制度的授权实验室。泰尔实验室的抗震质检中心,就是为公共电信网的主要设备提供抗震证明的唯一权威机构,需证明设备具有我国抗震设防7烈度以上(含7烈度)的使用能力。

泰尔抗震实验室拥有专业的抗震检验设备,包括国际先进的三向六自由度地震模拟液压振动台、强震垂直冲击波振动台、强震水平冲击波振动台、变电容式三轴加速度传感器、精密数据采集分析仪等,能精确模拟出具备X/Y/Z三向的九级地震情景。我们来感受一下华为存储在检测现场,九级地震的冲击力:
▲华为存储实验室抗震测试实例


想不想现场体验这种惊心动魄的感觉?我们通过泰尔实验室的专业支持,把三向六自由度地震模拟液压振动台搬到了华为成都研究所展厅,实时模拟强震体验。截止目前,我们的全闪存存储已经历了2578小时的“九级地震”考验,意味着在经历了上百场的强震后,华为全闪存存储依然工作正常。

地震是外部震源最致命的杀手,很多地震高发区域如日本,对IT设备的抗震有着非常严苛的要求。除了地震外,机房的异常环境(如高气压)、设备的运输/安装、设备内部震源(如风扇)都会带来危及设备运行的震动。因此,良好的抗震性设计对设备的良好运转至关重要。
华为存储在抗震技术上的厚积薄发
华为存储自2002年研发以来,一直持续追求硬件架构上的精益求精。早期,机械硬盘防震是一个最核心的问题。华为通过和新加坡DSI(Data Storage Institute)合作,掌握了业界最先进的有限元建模(Finite Element Modeling)、仿真、测试和优化的方法,在数万个观察例上进行数据校正,并成为了华为存储设备抗振的理论基础,打造出业界最稳定可靠的存储设备。

基于有限元建模的基础,华为存储形成了从机柜到机框、再到内部核心部件风扇、硬盘框等端到端的整机抗震保护,每一台送到客户手中的存储设备,都成功通过了30项跌落/冲击/工作震动测试,以及170+线路的路谱测试,这样才得以保证华为存储在各种环境下运行的稳定性。
机柜高强度连接方式

抗震设计上,对于需整柜交付的华为存储,做了机柜高强度连接设计,确保了2倍机柜承载重量时,机柜无不可逆变形;2.5倍承载重量的拉力做前、后、左、右四个方向的拉伸 ,机柜无永久性结构损伤。

机柜三维六向全自由度固定

对于机框进行了三维六向全自由度限位固定,保障框体刚性好不易变形,同时通过导销、卡口等设计,保障单板和模块的固定结合稳固可靠,对机框特别是硬盘框的保护,保证了整机系统综合抗震系数达到9烈度抗震验证标准。

内部关键部件/减震设计

内部震动源风扇,利用隔震和吸震技术,采用三级减震方案,通过风扇与支架、支架与模块结构件、模块结构件与机箱的层层减震,从而降低了整机震源风扇的震动量级,以降低对系统的影响。对震动敏感部件的硬盘拉手条,用外部刚性弹片设计克服低频段震动,内部减震垫设计克服高频段震动,既能保证抗震性能又提高硬盘的使用寿命,使我司硬盘返还率低于业界70%的水平。
稳扎稳打,匠人精神助力中国制造


当今世界,数据化巨变带来的是IT基础架构的更广泛运用。这意味着,我们需要考虑更严苛、更复杂的设备生存环境。

在全球地震最高发的国家日本,华为存储助力日本雅虎7/24业务连续运行;在波涛汹涌的海域,华为闪存确保法国AIDA游轮、德国Viking船上业务,在每次出海数十天的稳定运行;在环境恶劣的采矿区,华为闪存帮助澳州矿业south32实现百台采矿机的日夜运转与数据分析。

不断改进,满足各类客户的场景需求,这是我们的目标,也是我们的坚持所在。华为存储技术上的专注,不仅仅用于抗震,包括极端的高/低温环境、恶劣的酸碱腐蚀环境、高低气压以及突发状况等,我们都在充分考虑客户的环境需求,持续磨砺出稳定无畏的存储产品;同样,在高性能方面,华为存储通过对专有芯片与独有闪存算法FlashLink的持续研究,得以不断超越自我,出品一款又一款立足性能巅峰的产品。

好的产品来源于一点一滴的积累,我们将持续努力,稳扎稳打,匠人精神助力实现中国制造2025伟大计划。



- 相关回顾 -

脑子是个好东西,一口气了解全闪存存储最强大脑

噗,卖家不想让你知道的全闪存高端存储购买门道

华为存储全闪存的“核芯”力量


点击了解华为存储


    关注 华为IT产品解决方案


微信扫一扫关注公众号

0 个评论

要回复文章请先登录注册