专访听云吴静涛:“全栈溯源”如何推进传统银行的互联网转型

 

第三代平台不是以应用为中心,而是以用户为中心,银行要把以前可用为第一的设计理念,改成可用、易用到好用,提升自动化和运维水平,降低生产成本,注重应用性能管理,从而更好地与互联网公司在用户体验方面进行竞争。...



3月30日,由中国金融认证中心(CFCA)联合近八十家商业银行主办的“第五届金融品牌峰会暨2017中国电子银行联合宣传年启动仪式”在北京举行,会上揭晓了第三届中国金融品牌“金栗子”奖的最终获奖名单,并举行了颁奖仪式。

听云技术副总裁 吴静涛
峰会期间,听云技术副总裁吴静涛,就银行如何在移动互联网时代提升用户体验相关话题,接受了中国电子银行网的专访。

吴静涛认为,Y代人已开始进入市场,他们比X代人更注重用户体验。第三代平台不是以应用为中心,而是以用户为中心,银行要把以前可用为第一的设计理念,改成可用、易用到好用,提升自动化和运维水平,降低生产成本,注重应用性能管理,从而更好地与互联网公司在用户体验方面进行竞争。

以下为专访详细内容:

CEBNET:银行在信息化的转型过程中,会遇到哪些挑战,哪些因素将影响用户体验?

吴静涛:首先定义一下银行转型,这次转型到底原因是什么或者说为什么要去谈到有这样一个话题叫做银行的转型,最主要的原因是这两年政府在谈“互联网+”,作为金融来讲,无论是谈“互联网+”还是Fintech,都有一些全新的想法和思路,但如果从技术角度来讲,因为今天我们还是比较偏向技术的一个访谈,实际上真正最大的变化乃至于以前的服务器对PC,所谓的BS结构,到新一代云端结构的转换,实际上是cloud到smart phone,把智能终端取代了PC,然后把云计算取代了服务器,主要是这样一个技术基础的变革,导致了最近大家都在谈为什么要改变。这个是一个技术的基础,可是你要谈到市场需求上来讲,真正的变革来自于Y代人进入市场。

所谓Y代人的概念是这样的,像我这种属于七几年的人,在全球的分类里叫做X代人。X代人是七几年之后出生的,刚好赶上了经济大发展的年代,他们每个人都认为我只要努力工作就能得到回报,这一代的人实际上累计了非常多的社会资源甚至个人资产,因为他努力获得了回报,非常开心的一个结果。但他们的孩子所谓95后、00后的这批小朋友,有些甚至会定义到90后,他们出生的时候,他们的父母已经有一些钱了,他们没有这种非常努力去工作的欲望和愿望,于是,Y代人开始进入市场了。他们和X代人最大的区别,就是他们对体验的感受是非常注重的。

像我小的时候,说实话能吃饱就已经很好了。可是现在的小朋友,这一代人起来,说不好吃就不吃了。所以,当他去用网上应用的时候,他实际上有一个非常明确的需求,就是我的体验要非常好。这种体验要非常好,跟我们金融行业去构建IT整个的指导理念是冲突的。以现在银行跟互联网之间竞争为例,互联网最大的特色是低成本,服务允许有损,快速迭代,而且这三个东西当它到了金融行业里面的时候,金融行业讲的是我有社会责任感,一切以稳定为第一,以可用性为第一,但你要快速迭代就不可能稳定,这两个东西本身是有冲突的。真的当金融行业特别是银行业面对互联网这样一个冲击和竞争,在走“互联网+”这个过程当中的时候,事实上是存在着非常大的挑战,这是今天这个话题真正由来之所在,就等于客户的需求改了,要求要有体验,而技术基础又改了,从云计算+智能终端,它的这种突发性更大了,他的这种灵活性更强了,本身它和稳定性、和可靠性之间是有冲突的。所以,现在在银行业界有这样一个说法,银行要把以前可用为第一的设计理念改成可用、易用、好用的设计理念,这是它最根本的变革、变化或者说挑战,从根源到实际的状况,以及未来设计目标的转换过程。

这个过程直接导致了像听云的技术在介入市场的时候,会取得一个比较好的先发优势,就是听云实际上是和其他的IT企业不完全一样的一家公司,像我们绝大多数了解的这些IT企业,比如像服务器为主的,像IBM惠普、像虚拟化为主的VMware,像存储EMC,像很多IT企业,当然有微软、亚马逊,他们都基本上是坐在数据中心里为外部用户提供服务。事实上,如果按IDC的规范来讲,所有的这些IT企业都是应用为中心所构建的第二代的服务平台,这里面有一个名词我要稍微解释一下。

听云借用了IDC的这个报告,说的是很久以前以计算为中心的是第一代平台,就是以搭基为主导的。第二代平台就是以应用为中心的。所以,你可以看到现在主流的这些IT企业都是以应用为中心的,我的数据中心是以应用的可用性为第一目标,它是以应用为中心构建自己的基础设施,构建自己的应用,构建自己的运维体系。但是,IDC的规范说的是这样,说的是第三代平台,不是以应用为中心,是以用户为中心,这时候就产生了非常大的冲突和改变的可能,刚好又和今天移动互联网+云计算为模型的这样一个事实的技术基础变更产生了关联,也就是说在未来的三到五年里非常快速的全球的IT投资里,从以应用为中心将会慢慢的转向以用户为中心,而以用户为中心,总有一件事情要先做出来,那就是用户的体验如何,用户的感受如何,这些东西总要先知道吧,这样听云提出这样一个理念,我能不能知道以用户为中心,以用户的体验、用户的这种感受,以态势感知为切入点,从用户端往数据中心里面做,反着来。

一般的企业第二代平台都是以应用为中心,数据中心是往外面做,给外面提供服务。而听云的想法是以用户为中心,从态势感知发起,往里面走。这样就是一个非常不同的新的可能就会产生,这是听云最大的主线之所在,也是这次听云参加年会希望能够传达的全新的理念和技术解决方案的一个真实的想法和目标。

CEBNET:您认为应用性能管理(APM)服务会为传统金融行业转型提供怎样的帮助?

吴静涛:说到能帮上忙之前,我们先要谈一下现在的金融行业或者以银行为主导的数据中心建设,以及它的监控管理的方法和目标,以及它可能遇到的真实的挑战是什么,然后我们再去谈能够帮它做什么,能改什么,这样可能会好一些。

每个大的银行,在数据中心建设的过程中,都采用的是高可用为第一的这样一个基本原则,甚至在人行的规范里也非常明确写了这种主营应用的大范围的使用性的故障、可用性的故障,是这种高级别的事故,是要上报到人行、下发到全国的,等于是通报批评的这样一个动作,但这是非常不好的情况。因为在过去的几年里也有一些真正的银行被点名甚至被通报,也都发生过这样的事情。所以,在金融行业特别是银行业在做实用性构建的时候,都遵循的是可用性第一,比如像服务器肯定都是双机的,网络从网卡到交换机都是全冗余连接的,数据中心最开始是接一条互联网的电路,现在最多的我见过的客户接十几、二十条接入,每一条断了对我都没有什么本质性的影响。

数据中心也从以前的单中心变成了容灾中心、两地三中心、双活数据中心,前两天人行在上海去参观,当时还是工行的谷行长带队,去接待的做了现场业务的实施数据中心切换,就是双活数据中心在两分钟之内,把应用从这个数据中心切换到另外一个数据中心,我这个都已经做到了可用性的极致,这是非常不错的一个动作。

就像我刚才跟您说的,其实从可用到易用、好用变换的过程中,整个的监控体系或者数据中心的设计逻辑实际上是出现一些问题的,比如说以监控为出发点,可能会有带外管理,但这是一个技术语言,指的就是数据流量走数据流量,业务流量走业务流量,监控流量走监控流量,带外管理,就是在它之外。这是电信和金融里经常会用的一个称呼——带外管理,对服务器、对网络、对存储、对数据库都会进行非常精细地监控,当然如果发生了问题,要么双机切换,要么重启服务器,所以这是一个以可靠性为第一的设计、实施、运维的一个结构,而且运营了很多年了。在新的云端结构下,这个结构开始出现了致命的问题了,我们来细说一下,咱们说第一件事情。

以主机监控为例,如果发现了故障,以前的话恢复业务为第一,要么双机切换,要么设备重启,在这里面有三个R是特别好玩的称呼,这是经常我们和客户一起开玩笑的事情,第一个是重启进程,第二个叫做重启机器,第三个叫做重装系统,一般情况下都能解决问题,但这时候会造成研发很不开心,因为现场没有环境保留,研发很难判断到底发生了什么故障。但恢复业务为第一,以前就是这么做的,这个方法已经用了十几、二十年了,真的用了很久很久了。

可是要特别解释的一件事情,随着云端结构的变化,现在的一个主营应用,随着SOA跟企业总线的采用,包括现在的微服务、Docker的采用,一个主营应用不是在一个服务器上生成的,它可能在登录在这个服务器上,可能支付网关是在另外一个服务器上,旁边可能还有一些计时定位各种接口在用,到底这个用户访问不通了,是哪个应用组件造成的呢?运维的人不知道,更可怕的是随着虚拟化和Docker的引入,所以服务器在哪儿也不知道,现在一个简单的问题是我现在重启谁,我不知道是哪个机器,也不知道是哪个应用组件,我重启哪个我不知道,这个方法是不是就失效了。

回答是失效了。所以,对监控体系来讲的话,包括运维体系提出一个非常新的挑战,到底怎么做呢?以前是有办法,现在没办法,怎么办呢?这个时候一个新的监控体系就要产生。所以配合着云端来讲,Gartner它是全球非常有名的第三方机构,它专门规范了下一代的APM的体系,能够帮助到云端结构下,以用户体验为核心的用户性能管理体系,这其实是蛮先进的一个理念。

它在这里面包含了三个主要的组件,第一个是叫做用户体验的管理DEM,第二个叫做ADTD,第三个是AA,第一个是用户体验的监控,第二个是应用组件的深入的理解、跟踪和分析,谈的就是业务逻辑的自动拓扑,以前是一个服务器,我知道到底是哪些应用组件组成的,它在什么地方,IP是什么,服务状态又会有多少次的调用,这都属于监控的范畴,这是第二个部分。第三个部分就是应用分析,不同的语言和不同的系统间如何能够做跟踪,能够做智能分析,做机器学习,是这样三个方面的组成部件,但这个我说的稍微技术含量多了一些,不需要特别多的阐述它了。

这些组件如果翻译成我们非常容易理解的市场语言是什么呢?刚才是纯技术,这个不好用,翻译成市场语言是这样的。第一,以前我们只说数据中心的监控,而今天以云端为结构,以用户为中心,应该不应该把用户的体验监控给吃进来,走出数据中心,把用户体验也监控起来,这就是第一个DEM,这个非常简单,扩展数据中心的监控到客户端传输到数据中心的全过程监控,你把范畴能够扩展一些就可以了。第二步所谓的ADTD那么复杂,连我自己都没有记住的东西更简单,就是把你的监控的深度能够加深,以前的话是监控到主机、网络、甚至是TCP端口,不行,现在不够用,能不能监控到应用组件的逻辑,应用的调用逻辑,或者我们专业上叫做应用逻辑拓扑,或者你能不能监控到代码的运行效率,这个监控就比监控到服务器深得多了,这个实际上就是ADTD。所谓第一项的DEM,就是把用户端和传输包进来,扩展监控的广度,第二个是加深监控的深度,从服务器到代码运行、到业务逻辑拓扑,第三个所谓的AA不要想那么负责,就是自动化,提升你的自动化水平。

如果把这三项真实的,和咱们现在银行数据中心监控和管理结合在一起的话,实际上作为现有的监控体系是一个非常有机地扩展,它不是颠覆以前非常完善的监控体系,可用性第一,这个至少在未来的十年里面,对于金融业来讲是没法改的,可用性第一,这是没有办法改的东西。能不能在它的基础之上迭代一下,演进一下,到能够把用户端包进来,到能够把代码执行看出来,到能够自动运维、能够提升自动化,这样就有可能去应对Fintech的对面那边,就是互联网的那边,它的快速迭代,成本很低,我们这边至少可以做到的是快速发现、快速处理。你都能够监控到代码运行了,当然发现很快,快速发现快速处理,同时能够提升自动化和提升自己的运维水平,降低生产成本,这样的话才可能在一起基本上有个斗的可能,否则只能是太吃亏了,这实际上是下一代的应用性能管理平台真正的能帮到银行业,所能提升的能力之所在。

CEBNET:“秒极时代”和“全栈溯源”,一个从时间维度,一个从空间维度,您如何解读这两个新颖的概念?

吴静涛:当您说到秒极时代和全栈溯源有这种时空的感觉的时候,实际上刚好是您能感受到我们当初在设计这个思路时的一些真实的背景。我明确解释一下它的字面含义是什么,秒极时代是指用户体验上以秒为单位的极致的用户体验的一个时代,它所对比的实际上是像互联网在95年之后发展会比较快一些,1997年到1998年就提出了所谓的八秒钟的眼球理论,页面你有8秒钟还没有怎么动的话,人就走了,流传了很多年的理论。

在2012年听云和我国的工信部在一起发布了一个叫做首屏时间的指标,它的理念是这样的,假如是以新浪为代表,新浪的一个页面可能有五六屏,但真正影响你体验的是第一屏出来了,你看到了,当你再往下拉的时候,实际上网络的时间是很快的,等你往下拉的时候已经过去了,真正影响你的体验的是第一屏,首屏时间是非常关键的。

当时我们和工信部一起发布了3秒钟的首屏时间,作为八秒钟眼球理论的下一代的迭代,后来在去年,去年听云主办了首届应用性能管理大会,当时发布了秒极时代,因为也带到秒了,这么多年努力过去了,秒极时代指的就是用户体验真的以秒为单位来计算,那么到一秒,因为我们发布了很多行业、很多应用场景的时间,真的是有些行业有些场景已经无限接近秒这个时间值了,刚才我们开始就谈到,Y代人90后、00后,他们对体验要求非常高,真的能在体验上面给他们最极致的一个体验,这很明确地是说无论对互联网还是银行,都有提升用户体验,提升月活,提升客单值,提升交易笔数去降低生产成本,去提升利润率这样一系列的后续的动作,所以,如何去达到秒极时代的体验是听云能够帮上忙的。这样说等于是空口白牙,怎么帮呢?要有方法,这个方法论我们叫做全栈溯源。

全栈溯源是指从用户端发起访问开始,到整个后台的服务应用回应为止,中间所经过的每一个环节,每一个应用过程,每一个应用组件的全过程、全栈的跟踪跟溯源,查询、分析、整理、汇报跟监控的过程,跟警报的过程,这是一个非常难的一件事。就像您刚才说的,感觉有这种空间的感觉,确实是,因为很有可能一个用户是在欧洲,拿着这部手机访问了一个后台应用在北京,真的可能就是隔着上万公里,这么长的一个时空转换,你还要从头跟踪到尾,还要把中间的问题出在哪儿抓出来,我觉得这是非常困难的一件事情。但是我要特别解释一下,这对于应用为中心,到以用户为中心的转换是至关重要的,我来给你举一个最实际的例子,这样大家都会比较容易理解一些。

如果在以前,以应用为中心所构建的一个银行的主营服务,比如网银,在网银里面,它的监控是这样的,就是从外网网内访问,这样网银是能够服务的,如果能够服务这件事情跟我就没有关系了,这是以可用性为第一,做这个服务监控。如果有人投诉,咱们怎么查呢?那就在监控中心里看,服务器正常不正常,网络正常不正常,流量正常不正常,内存正常不正常,网卡正常不正常,就给他们汇报是什么呢?各位老大,我的网银服务是正常的,没问题,您有体验不好的地方,可能是您的问题,这就和我没太多的关系,大哥你可能是不是人品不好,有这个可能性。

这个说起来是个笑话,但它实际上体现的以应用为中心构建的基础设施所构建的服务,所构建的应用和监控,就只能汇报说我的应用是好的,您老人家用的不好,我真的帮不上你,别急,如果以用户为中心的时候,现在一个用户说对不起,体验不好,那你说跟我没关系,我这儿挺好,你人品有问题,这肯定是不现实的。怎么做到这件事情?这实际上就是下一代的应用管理平台听云所做的最主要的一件事情,就是全栈溯源,我们能够做到的是什么?我们能够做到把客户端从发起访问到最后结束为止全过程串起来,这时候如果我们的某个VIP用户甚至是某个管理职能上的老大,甚至是他的朋友在投诉的时候说为什么我用这个体验不好,这个手机银行怎么搞的这个体验不好,以前的话只能说大哥我这个手机银行应用是好的,可能是你的问题,现在不用这么说了,现在我只要把这个人从头到尾的性能到底损耗在哪里,时间到底去哪儿了全查出来,我就可以非常准确地判断是什么原因造成的,这样我就可以知道问题发生在哪里,有非常好的整改建议,快速进入整改,这个问题就被解决掉了。越来越多的用户把体验提升了,慢慢去逼近秒极时代这样一个时间点,所以全栈溯源是听云为了银行业的用户能够真正去实现秒极时代所设计的一整套的解决方案,这样一个时空转换的过程就出来了,实际上它是对第二代以应用为中心、到为平台,到以用户为中心的平台做提升、做跨度的一个非常重要的工具,跟手段方法。

了解更多信息及听云产品请点击“阅读原文”申请试用


    关注 听云


微信扫一扫关注公众号

0 个评论

要回复文章请先登录注册