为武汉农商行建立业务级IT综合管理系统

 

商业银行如何建立靠谱的业务级IT综合管理系统?思路在这里!...





项目背景

武汉农村商业银行(以下简称“武汉农商行”)是国务院、中国银监会批准成立的全国第一家副省级省会城市农村商业银行,于2009年9月9日正式开业。跨区域经营发展走在全国农商行前列,目前全行200余网点遍布城乡各地,并先后在湖北省内设立了咸宁分行、宜昌分行、黄冈分行,在江苏、广东、云南、海南、湖北五省设立了三十余家村镇银行。

随着银行业务的开展,农商行建立起各种通信支撑网、核心业务数据网、柜面交易系统等,涉及大量的网络设备、业务专线、服务器、数据库、存储、业务中间件、安全设备等,传统的单一工具容易造成信息孤岛,无法适应复杂的业务分析,人工巡检的低效率也已经无法满足大系统的日常运维要求,为保障业务系统的安全运行,需要建设一套一体化的综合运维管理系统,实现业务系统的不间断故障预警、性能瓶颈分析和为网络优化提供各纬度的分析报告。

用户需求

“武汉市农村商业银行IT运维监控综合管理系统”是要建设一个整体的IT运维保障体系,保障业务的安全稳定运行。建设的思路是要改变传统的以IT基础设施为核心的管理方式,转变为以“业务价值”为管理核心,关注的不仅是某项技术,例如机器是否运行,网络是否通畅等,并且要能找出哪些地方存在瓶颈,IT的性能和事件对业务的影响,主动关注业务价值,实现IT与业务的真正融合。



综合运维保障平台建设就是要从以往的站在IT的角度看业务,转变为站在业务的角度看IT,从而实现从面向IT的运维保障转变到面向业务的运维保障,更加突出预防和预警的能力,把IT能力与业务量的关系管理起来。

具体而言,运维保障平台的建设目标包括:

1)根据武汉市农商行的业务现状和管理体系,以业务价值为管理核心,建立起一整套符合ITIL标准体系的7×24小时安全运维保障体系,建立健全农商行IT运维部门的管理制度,制定管理流程,明确管理职责,并根据业务现状对现有IT管理结构提出合理化建议,保障农商行IT基础设施的高稳定性和高可用性。
2)建立全方位IT基础设施监控平台,实现对主机、网络线路与设备、存储、数据库、中间件和通用应用全方位实时监控,对信息系统软硬件主要指标进行监控,并提供事件、故障报警,让IT管理人员对全局IT基础设施的运行状态做到24小时心中有数。
3)根据武汉市农商行的业务管理现状,构建起业务与IT的关联管理视图,使得IT管理人员根据不同的业务需求评估IT基础设施的可用性,在业务服务能力严重下降之前预先做出应对措施,并能准确定位IT基础设施的瓶颈所在,变被动管理为主动管理,使IT管理人员做到对系统全方位、深度、及时的掌控。



4)实现强力有效的安全管理,在安全事故发生之前,通过安全集控平台,及时发现IT的安全漏洞,防止安全事故的发生。
5)对业务系统的操作性能进行端到端管理,将交易所经过的各个层面的详细性能数据有效的关联起来,分析、判断问题的根本原因,从而让IT运维人员迅速的发现IT系统的性能瓶颈,快速解决问题,提升IT设施的可用性。
6)实现规范化、运转协调的运维服务管理,以全面的IT资产库为核心,以知识库建设和管理为基础,建立故障和事件处理的管理流程和监督体系,实现事件处理工单化、问题管理流程化、故障处理模式化、运行服务管理工作标准化。

解决方案

通过实地业务调研、分析和用户讨论,结合运维系统的建设目标,并且充分考虑到后期用户两地三中心的核心系统建设格局,北塔软件为其提供了运营级的跨平台、一体化综合运维管理系统,可为分散型地域用户提供层次化管理,提倡“下级维护,总部监控”的管理方式,实现性能和告警运维由各分部实现,总部实现统计和监管。总部系统实现“拓扑集中、集中报表、业务集中”。
依据建设目标,本期项目为用户设计如下功能项:

1. 综合运维门户:在一个统一的WEB门户中实现单点登录、统一系统管理、个性化内容展现、统一监控展现、待办事务提醒,并提供系统集成与接口。

2. 基础监控:对武汉农商行IT基础设备的状态、性能、故障、告警进行全方位实时监控,包括网络系统监控、主机设备监控、存储设备监控、安全设备监控、机房环境监控。

3. 业务监控:对武汉农商行业务系统和相关的数据库、中间件的状态、性能、故障、告警进行全方位实时监控。一期主要包括核心业务、综合前置、Eteller前台、中间业务、银联、农信银、网银平台、支付结算、信贷管理、金融IC卡、指纹系统、加密服务平台等系统。

4. 自助设备监控:对武汉农商行自助设备主要部件的状态进行监控,支持设备发生故障或特定事件时实时发出告警,以多种形式通知相关人员,使设备达到无人值守运行的要求。

5. 资产管理:对武汉农商行所管理的全部IT设备进行全面细致的管理,包含IT设备的基本信息、采购信息、维保信息、合同信息等。包括IT资产库、资产合同管理、资产维保信息管理和资产查询统计功能。

6. 安全管理:实现对操作系统、防火墙、交换机/路由器、IDS、IPS、防病毒系统、web服务器、数据库、中间件等IT基础设施的安全事件、日志、告警进行图形图表化的实时监控、跟踪与分析,使得IT管理人员能通过分析结果及时发现IT的安全漏洞,防止安全事故的发生。

7. 性能管理:通过对网络协议和服务的检查,查看网络为业务提供服务的可用性和服务质量。提供异常流量检测、流量管理、分析和优化的一体化解决方案,为建立可靠、可控的网络提供强大的技术手段和管控工具。

8. 自动化运维:建立符合ITIL规范的标准化运维管理流程体系,涵盖事件管理、问题管理、变更管理、配置管理、服务级别管理五大流程,建立运维知识库和值班管理,并支持流程的图形化管理。

9. 统计分析:为各个功能模块提供图表统计支持。报表输出格式可转换为Word、Excel、PDF、Html等多种常用的标准格式。可支持实时的报表查询,支持用户自定义报表样式,定时生成并自动发送到指定邮箱。

使用效果


1. 互联互通





IT综合运维管理系统作为信息化管理大平台的一部分,从设计之初就作为大运维体系的有效组成部分,为用户预留有丰富的南北向数据接口,可方便的实现运维数据的集中化、业务化关联分析,打破传统网关的孤岛数据模型。在农商行项目中,北塔软件产品作为中间管理部分,采集共济机房管理数据,作为设备工作的环境预警数据,同时将配置、性能、告警等数据传送至农商行运维管理平台。在数据接口的支持上,产品同时支持:

  • 数据库接口
  • MQ接口
  • XML文件接口
  • SYSlog日志接口
  • 具备独立的数据传输接口(API&SDK)
  • 传输配置数据、事件数据、性能数据
  • 北塔软件为ITSM提供全面的事件数据

2. 效益分析

2.1. 实现网络和系统的可视化管理




通过对农商行通信网络、业务组件(操作系统、数据库、中间件)的监测实施,实现了网络和系统的可视化管理,将原来分散的自动和人工监控进行了整合,形成了以可视化为导向的监控展现,变模糊为清晰。


2.2. 实现网络和系统的量化管理 





实现了对网络和系统监控的可量化管理,从运行指标量化、资源效益量化、服务提升量化等角度评估网络和系统运行质量,避免了以前人工评估的主观性,转而通过当前指标分析、趋势比较分析、资源信息统计等给予管理人员数据支撑,为IT持续投入带来的运行质量和管理提升效益,提供事实依据。

2.3. 变被动为主动化管理





系统初步建立了统一的事件管理机制,通过自动化的监测来发现运行质量的瓶颈,并对各类波动事件进行过滤,定位告警的根源,通过预警机制和自动化脚本处理机制的结合,达到事前防范;通过通知机制和故障流程,实现事中控制;通过对故障和处理的统筹分析和知识库机制,逐步优化事后分析体系,杜绝错误重犯,从本质上提升运维水平。

2.4. 集中运行展现





在同一平台上,集中展现网络拓扑、业务拓扑、机房拓扑,展现运行监测的数据、告警信息等,为集中管理提供统一平台。

2.5. 运行和运维质量的量化管理



通过业务质量水平指标和业务服务水平指标,量化信息中心对外提供的业务质量和服务质量。


    关注 北塔软件


微信扫一扫关注公众号

0 个评论

要回复文章请先登录注册