又是一年双11,走近京东研发指挥部……

 

走近双十一前夜的京东研发指挥部。。。...



对于电商企业,双11是一场“大战”;对于守在电脑手机前的买家,双11是一次“狂欢”;而对于京东的技术人来说,双11是一篇篇日历,一次次积累,一场场备战,和一夜夜乐此不疲的付出。

从便宜就能抢滩,到对价值、品牌、服务有要求的理性购物,我们看到了用户消费需求和习惯的改变。而京东,正通过一步步扎实的技术进阶,为消费者的品质购物需求提供保障。

在双11前夜,不妨和我们走进京东,走进京东总部大厦的研发指挥部,走近技术人的世界——
孜孜不倦的技术搭档,

你们认真到快钻到屏幕里去啦。。
研发指挥中心


在京东总部大厦一楼的研发指挥中心,我们见到了京东商城研发副总裁马松。站在研发指挥中心大屏前的马松相当自信,他表示,随着用户物质水平和精神水平在不断提升,用户们的需求也越来越丰富多变,京东技术团队一直以“如何让用户获得更优质称心的产品、更快捷的物流配送、更贴心的关怀服务”为宗旨。
就此次双11来说,京东一方面将依仗不断夯实强大的基础架构,保障海量订单涌来时用户流畅的购物体验,更将通过大数据、机器学习、人工智能技术的商业实践应用,打通完整的智慧化零售产业链,涵盖营销、供应链、物流、安全等领域,实现京东智能化商业体系迅速落地,在这个双11里,让用户能尝到更多科技发展前行带来的惊喜和极致体验!
基础平台
顾名思义,基础平台部门要保障的是电商平台的两个基础能力:一、是对故障的应对能力,即实时响应的能力,二、是对于大流量的抗压能力。

当我们看到京东商城总架构师刘海锋的时候,他正和他的队友们在会议室开会。
“今年是我第四个双11了,我发现,我们的备战越来越轻松了。”面对询问,刘海锋充满自信的说,针对今年的双11,京东商城基础进行了充足准备:

首先是故障应对能力。在大规模故障演练方面,基础平台引入了一个有意思的新的演练方法,即任何一个体系,一个业务,都会两组,由一组扮演故障制造者的角色,另外一组扮演团队故障的解决者和响应者。当模拟故障发生的时候,我们要求整个团队检测、响应、处理还有恢复的时间,这样就大大提高了对大规模故障的容错能力。

第二是抗压能力。大促的时候最考量的是电商应对峰值流量的能力,特别是在“双11”这样的大型促销节日。刘海锋用了一句话总结京东技术在这方面的提升——“四年前的双11很多压测是靠人,但是在今天以技术驱动业务的京东,我们依靠的是技术,是人工智能,这是一个非常显著的变化!” 例如应用各种类型的机器人(如ForceBot,军演机器人等),去模拟即将发生的问题,通过机器人以及相应程序,模拟大促活动中大流量涌入平台的状况,以此种方式对平台可承载的流量压力进行评估,并优化,这是是一个重要的创新。
交易平台
根据以往的经验,双11期间各系统的流量会在进入11月后明显上升,双11当天是平时流量数倍,个别系统则每次都会创流量峰值记录。作为交易平台,面临的挑战是除了要为大促期间的系统稳定做各种技术准备,同时继续满足业务需求的研发工作。据京东商城发部交易平台负责人王晓钟介绍,交易平台早在8月底就开始了备战工作,从系统的性能提升、高可用方面两个方面做好了充足的准备。
在性能方面提升方面,在保证可接受的调用耗时下,尽可能的提高系统的吞吐量;在高可用方面,交易平台则针对不同系统的特点,梳理和准备了658个系统故障预案,并进行实战演练74个。
要保证从用户浏览、加入购物车、下单后计算价格、到库存清点等所有交易环节的顺利进行,王晓钟还特意提到了两个亮点。

1、秒级放大镜——秒级性能监控系统。通俗来说,就是交易平台为原有的统一监控平台加了放大镜,将原来分钟级粒度细化到秒级。这样,在秒级监控下,技术人员可以更加细微、即使的掌握系统状态!

2、快!抓住那只捣乱的猴子——交易平台将系统可用性、预案执行效果,以Chaos Monkey(捣乱的猴子)的方式来验证。具体来说,就是将熟悉系统的人封闭在一起,准备各系统的故障场景并随机选择若干场景,不定时、不通知的进行系统破坏,由团队内其他成员对故障进行响应处理,更加真实的考验了预案的执行效果。
大数据部门
走到大数据部门所在的会议室,里面的环境是紧张却又让人踏实的,帅气的技术小哥们各个手拿电脑,冷静的盯着电脑屏幕,只是偶尔与旁边的邻座细语几声,我们向京东搜索研发部负责人王超招招手,他放轻脚步,向我们跑来。

王超介绍,今年搜索部门针对这次双11可谓是做了特别准备,这次架构上准备了新老两套搜索系统,新系统采用分布式设计,创新好用,而老系统经过多次大促更为稳定,让人踏实。在降级手段上,也做了缓存时间可调、灾备缓存数据提前填充等各种设置,结合使用新系统作为互备,将风险降低到最低。
“其实今年是我第一个双11,但是我记得每一次的京东大促,带给我的都是极其难忘的回忆,因为只要峰值一过,整个屋子都在庆祝”
本次双11,王超负责的搜索系统是京东最重要的流量转化产品系统。在王超的带领下,系统的稳定性和转化率一直齐头并进。搜索新的分布式系统是大数据部门这一年来的重中之重,用过新的分布式系统可以让京东搜索索引比现在多几倍的产品量。此次双11,王超团队在搜索促销转化上开发了满减外露、大促query基于大数据的特殊结果等功能,“我们相信会有不俗的表现成果!”王超充满自信的说。
云平台
京东基础设施部总监何成的工作有些与众不同,用他的话总结就是“我们团队的工作都应该做在前面,如果今天我很悠闲,那说明我们之前的工作做得很充足。”

对于云平台来说,资源备战一直是应对618和双11最基础的工作,但又是最复杂的。不仅涉及到旧机房机器搬迁,还涉及到配件采购,新机器分配,安装,各业务线需求沟通协调等等。何成介绍,今年资源备战他们提前3个月就已经开始,本着“旧机器利用+少量新机器采购”的原则,为今年的双11提供了充沛的弹性云资源。在机房保障方面,何诚团队通过新建设的IDC基础设施平台提供数据支持,全程跟踪和监控资源准备和服务器故障,百分百保障机房双11期间的顺利安全运行!
看见何成的时候,他正坐在角落的沙发里,悠闲地用手机购物。所以,云平台的工作做的很充分,大家可以放心购物了!
安全中心
京东集团信息安全部响应部负责人李学庆,总给人一种十分踏实安心的感觉。自2011年入职京东以来,李学庆经历了京东架构改造、业务的飞速发展。如今,双11已从一个光棍节转化到购物狂欢节。同时,随着外部攻击技术水平的增强,京东技术的防御和追溯能力也需要有很大的超越。李学庆表示,每次在双方的对抗中取得胜利是对我们团队最大的考验!
其实,信息安全部早在10月初就开始筹备双11大促备战情况。本次备战不仅把传统的安全检查、例行排查放在的备战中,还通过攻防路径规划、真实风险演练、核心系统排查、外部白帽子保卫双11活动、威胁情报接报、核心资产排查等。对整体的双11备战任务明确进行分工,进行了更加立体化的全方位备战。不仅如此,针对本次双11专门开发的监控系统“哮天犬监控系统”将针对京东重大漏洞、APP渠道问题以及各业务线出现的高风险安全问题进行实时监控,保证整个京东双11的安全平稳运行。





———双十一背后还有更多可爱的“京东人儿”———

采访的时候,很多项目负责人都有提到,最难忘的就是备战熬夜的日子与同事共同分享的小食~


    关注 咚咚小报


微信扫一扫关注公众号

0 个评论

要回复文章请先登录注册