【存储安全月】存储应急要点

 

存储故障应急一般结合MDS存储管理服务器、NAS存储访问服务器、FISEC存储同步服务器、Stornext文件系统,以及交换机、存储本身等制定应急方案。...



为了减少因存储故障对节目制播的影响,我们运维人员不仅要做好日常的维护巡检,更要掌握应急的技能,在故障发生时,能够快速判断,冷静处理。

以下是由专项培训存储组学习委员王锐昕根据日常工作总结的存储应急要点,供大家参考学习,具体操作以各项目的作业指导书为准

存储故障应急一般结合MDS存储管理服务器、NAS存储访问服务器、FISEC存储同步服务器、Stornext文件系统,以及交换机、存储本身等制定应急方案。

硬盘故障导致业务卡顿

▶硬盘已亮故障黄灯,登录存储管理界面检查故障硬盘状态,若硬盘处于已经故障removed状态,对于支持热插拔的存储,在保证数据已经备份的情况下可以直接更换故障硬盘。

▶若硬盘出现告警,如EMC存储会有soft media error等告警,需提前对此硬盘执行hotsphere热备操作,待数据备份完毕后,硬盘告警灯显示故障黄灯且硬盘为removed状态,方可更换故障硬盘。

控制器故障

▶对于双控双活的存储,单控制器故障不会造成业务中断,但会影响业务性能,针对控制器故障结合存储告警日志对故障控制器进行处理;

▶两个控制器同时故障,需切换备存储,较为快捷的方法为在客户端以及需要访问存储的服务器上修改Stornext客户端上将指定的主存储卷标名直接更改成备存储卷,即直接达到从访问路径上的主备存储切换,操作速度快,并且可逆操作;若主备存储网络为双链路冗余,此切换方法对前端业务无影响。

MDS存储管理服务器故障

▶单台MDS服务器故障,备MDS服务器自动接管,针对双控双活的存储对客户端业务无影响。

▶两台MDS同时故障,属于存储系统严重故障,存储素材无法访问,需尽可能恢复一台MDS服务器尽快恢复业务;若在MDS无法恢复的情况下,经有关领导批准,切换最小应急系统恢复制作网业务。

我是广告栏


本期【悦读】专栏的关键词是“善意”,投稿截止时间为6月6日,期待您的来稿。

【员工风采-show time】版块随时接待各位的光临。


    关注 索贝运维


微信扫一扫关注公众号

0 个评论

要回复文章请先登录注册