【IT前沿】IT基础设施:高效、敏捷和开源

 

IT基础设施,包括服务器、存储、网络等硬件设施,也包括数据库、操作系统、中间件等基础软件环境;它是IT应...



(点击上方蓝色字“东航信息部IT百分百”关注)

IT基础设施,包括服务器、存储、网络等硬件设施,也包括数据库、操作系统、中间件等基础软件环境;它是IT应用系统运行的平台,也是数据中心的核心设施。

IT基础设施的重要性无容置疑,而且它在IT的投资中所占的比例非常大,在IT运行成本中的比例几乎是超过软件的,并且它对IT软件的运行性能、安全等等起主要作用,因此IT基础设施不仅需要与时俱进并且需要有所超前。

随着云计算的大力发展,IT基础设施可以说发生了革命性变化,由以前以自己建设为主的方式将逐步转化为租用云计算的方式,大企业也许将采用自建云计算和租用云计算的混合方式,也就是所谓的混合云。

IT基础设施的问题有很多,本文论述目前的核心问题:高效、敏捷和开源。关于高效:

IT基础设施的效率包含利用效率和运行效率。以最常用的CPU使用率和存储使用率来说,以前新系统设计时,以三年的预估增长为设计目标,即在三年后预计计算量和存储量增长作为上线时服务器和存储设备所具有的计算能力和存储能力的依据。所以在上线初期设备能力利用不足,理论上可能不到三分之一。如果再加上双机冗余备份资源,则主机(服务器)的计算能力初期利用率在六分之一以下(存储在磁盘阵列架构下不变)。但是到了三年由于使用率接近峰值又使得运行效率低下,用户集中使用时会感觉慢。

关于敏捷:

软件系统一旦上线运行,任何软硬件的更改都是复杂而有风险的事情。这意味着IT基础设施不能“随需而变”。而随着“互联网+”等电子商务的兴起,业务创新和用户需求的多样性使得IT基础设施已不能适应快速变化的市场和竞争要求。促销、打折、节假日等市场活动往往有临时性的大计算量需求但常规IT设施配置根本不可能满足,IT基础设施成为业务的拖累。

关于成本和开源:

传统的IT基础设施的硬件都是由厂家设计制造,一般都是通用的、最大程度满足各类用户需求的某一类设备(计算、存储、传输等等),因而对具体用户的具体应用要求来说,硬件设备上的某些配备是多余的、浪费的,也是造成IT基础设施成本高的原因之一。软件开源已经普及,开源的目的之一是为了降低成本,因为有些正规软件的价格昂贵并且限制颇多。新的趋势是硬件也走向开源,目的之一还是为了降低成本。

比照开源软件的概念,开源硬件指自由及开放的方式设计的计算机和电子硬件,包括控制软件、电路原理图、材料清单。设计图等都使用开源许可协议,自由使用、分享。以Facebook领衔的OCP(Open Compute Project)是开源硬件的大型组织,目前已经有包括EMC、微软、IBM、VMwear、苹果公司、Google等200家企业加入。作为一个开源的硬件项目,OCP不仅公布Facebook定制的数据中心和服务器细节,还包括机架和主板的CAD图纸,更邀请开源社区及其他合作伙伴免费使用并共同改进。也就是分成两个步骤:先公布规范和机械图纸,再与社区伙伴共同改进它们。

解决IT基础设施的高效、敏捷和成本问题,新的很好的解决方案是:

虚拟化技术和云计算技术是目前解决效率问题的最好方案。
对IT基础设施的二个主要部分服务器和存储来说,如果统一分配、配置和管理所有服务器和存储资源,按需分配计算能力和存储容量就能极大提高资源利用率,这就是虚拟化技术的思路和好处。网络也可以虚拟化,其他硬件设施基本都可以虚拟化。

虚拟化的下一步就是云计算技术。云计算初衷就是希望计算环境(包括所有和计算相关的服务资源)像水、电一样按需分配和使用,使资源利用得到极大的提高,同时成本降低、效率提升。如果完全使用公有云用户就可以不必自建IT基础设施。我觉得中小企业、新成立的电子商务公司、创新型企业等如果没有特殊应用要求应该完全使用公有云,在成本、可靠性、敏捷性、方便性等主要方面基本能满足一般性需求(只是一般性需求。连大名鼎鼎的亚马逊云计算最近都出现三次系统崩溃的事故,最长时间20多分钟)。

大型企业自建云计算,也使用公有云,即混合云。一种使用混合云的方法是将某些面向广大用户的软件系统放在公有云上,而内部业务和管理使用的是私有云,即应用软件部署完全分开。最新趋势是某些应用系统既使用私有云也使用公有云,这些系统的特点通常是临时会出现大流量(如促销时)。比如销售管理系统,在正常情况下使用私有云,但是可以将查询模块部署在公有云上。当进行促销时,由于查询请求的流量大,可以让它在公有云上计算(利用公有云的横向扩充方便的特性)。这样的方案和架构很好地解决了私密性、成本和用户体验(计算效率即速度)的平衡问题。

但是云计算的一大问题是如果云平台崩溃影响面非常大(崩溃的原因往往是软件Bug,不幸的是软件Bug总是存在)。所以也有观点认为分散化能避免“崩溃蔓延”的问题。
软件定义(包括网络、存储、数据中心、基础设施、应用服务等等)使敏捷性大大提高。
软件定义的产品最成熟的是网络和存储,已经在数据中心大量使用。通过软件定义最大程度体现灵活性,这就解决了快速响应业务变化的问题。实际上云计算平台也可以算是软件定义,云计算资源池的所有资源必须通过软件管理、配置、分配和变更。

但灵活性必定以复杂性为代价。软件定义的基础设施(或数据中心)的管理难度、配置复杂度、对技术人员的要求都大大增加了。非大型企业和数据中心不会采用软件定义的技术架构。为此IT业界也采用一些方法降低复杂性,如IBM的方案号称可以使IT基础设施“简化部署、降低管理复杂性并建立自动化基础”,“预测和相应地扩展资源,满足不断变化的工作负载需求”。这正是软件的特长:“分析、预测和自动化”。
硬件开源是降低成本、提高IT基础设施效率和利用率的大趋势。
硬件开源也只有大型企业或大型数据中心所能做的,因为它对技术(跨领域技术)的要求比较高。以著名的OCP(开放计算项目Open Compute Project)方案来说,作为一个开源的硬件项目,OCP不仅公布Facebook定制的数据中心和服务器细节,还包括了机架和主板的CAD图纸。2011年成立以来已经设计了服务器(板卡)、电源、机架、存储、网络等等。

比如2014年微软公布了她的服务器设计。微软最初贡献了两种设计:一个计算刀片和一个JBOD(Just a Bunch of Disks,一堆硬盘的简单集合,无处理能力,需配合计算节点使用)刀片。计算刀片在主板上配置了两颗至强E5-2400 V2处理器,两个计算刀片则可以并排放入一个单一的1U服务器槽。每个刀片支持6个DIMM插槽,并配有英特尔存储控制器,一个PCI-E插槽,网络上支持单个或者两个双10GB夹层卡,双4X 6Gb夹层卡。JBOD刀片在一个抽屉柜中最多放置60TB的硬盘。微软表示这种设计模式可以在52U机架上放置高达96个服务器(48个1U双刀片服务器,再加上网络)。这些设计与微软被授予的“托盘和机箱刀片服务器架构”的专利相匹配,微软先去申请了专利设计再捐献出来。具体而言,微软捐献的包括服务器硬件和软件规格,既有计算机辅助设计(CAD)模型、原理图,也有机架基础设施,比如服务器管理、风扇以及电源控制、诊断和修复的源代码。

又如网络设备的开源设计,OCP的开源交换机项目主要是开源硬件,但也包括部分软件。定义一套标准化的硬件设计,标准化包括:交换机硬件电路板中要用哪些类型的器件、CPU和各种器件之间用什么样的接口、芯片接口类型和数量、各个器件地址空间、镜像文件在flash中存放的位置等等。基于这样的硬件规范,各个厂商或者代工厂可以生产符合OCP标准的硬件(网络)交换机。目前OCP针对的主要是数据中心ToR(top-of-rack)交换机,后面会扩展到汇聚层交换机(Spine/leaf(叶脊拓扑结构中leaf叶节点,spine脊节点)架构中的Spine),但是实际上它们也都适应于企业网交换机。

OCP网络项目的阶段性目标,先从传统单体式(Monolithic)交换机到软硬件解耦,再进一步模块化。硬件部分包括模块化机箱、交换机模块和“Group Hug”微服务器。ONIE(Open Network Install Environment开放网络安装环境)定义了一个开源的“安装环境”,将boot loader(引导装载程序)与现代的Linux内核及BusyBox(常用Linux命令和工具软件)相结合,提供了一个可以安装任何网络操作系统的环境,有助于自动化大型数据中心的(上千台)交换机配给,让用户像管理Linux服务器一样管理交换机。

开源网络产品的案例如:Juniper Networks 2014年12月初发布的基于OCP设计、运行JUNOS操作系统的OCX11000交换机;Alpha Networks公司(台湾明泰科技股份有限公司)设计SNX-60x0-486F是OCP交换机,可作为ToR或汇聚层交换机使用。Cumulus Networks公司的开源网络交换机操作系统,可以运行在标准的商用芯片交换机平台上。戴尔现在的模式就是利用戴尔硬件平台,去整合用户操作系统,形成一个端到端的解决方案。已经有用户利用Cumulus的操作系统和戴尔的硬件实现云计算解决方案,提升整个网络功能的灵活性。

使用开源硬件技术对用户的要求很高,所以目前除了个别超级用户(如Google、Facebook)的大型数据中心外,其他用户也只能利用根据OCP规范开发的现成产品搭建IT基础设施或数据中心。但是开源硬件大趋势是肯定的,也会逐步扩大市场和应用。



图:OCP网络产品
- END -
本文是“东航信息部IT百分百”原创,转载需注明出处
转载须保持以上所有内容完整。
文 |  王鲁平


    关注 东航信息部IT百分百


微信扫一扫关注公众号

0 个评论

要回复文章请先登录注册