|
|
|
|
移动端

Fair Isaac:谨防虚拟化带来的下一波问题

在费埃哲(Fair Isaac)这家打出的FICO评分评定许多公司资信状况的公司,虚拟化技术带来许多好处的同时,也带来了一些意想不到的问题。

作者:布加迪编译来源:51CTO|2011-11-16 10:58

开发者盛宴来袭!7月28日51CTO首届开发者大赛决赛带来技术创新分享

【51CTO独家 11月16号外电】在费埃哲(Fair Isaac)这家打出的FICO评分评定许多公司资信状况的公司,虚拟化技术带来许多好处的同时,也带来了一些意想不到的问题。

费埃哲公司将其70%的服务器进行了虚拟化处理,服务器数量因而从5000台减少至1500台,减少了资金和电力开支。此外,它过去常派一名系统管理员负责管理30至50台服务器,而现在一名管理员就能管理150台服务器。IT副总裁Tom Grahek说:“将来我们能够把这个数字提高到多达250台。”Grahek表示,费埃哲在每台服务器上能够平均运行30个虚拟机,耗用的可用处理器周期却只有总周期的一半。他的团队现在能够在短短30分钟内配置好一台新的Web服务器、数据库服务器和应用服务器,“这个过程以前需要好几个星期”,他表示,而停用这些服务器完全一样快。

问题的一方面恰恰也出在这里。由于容易配置,这“给人造成了一种错觉,以为虚拟服务器就是免费的。”Grahek说。过去,要不要批准对服务器容量提出的申请由IT部门来决定,因为好几个星期的准备时间让IT部门自然有机会来看管。而现在,费埃哲的IT团队把服务器模板放到目录中,业务部门的最终用户可以根据该目录,自行开始使用服务器容量。IT部门衡量服务器容量的使用情况后,向使用容量的业务部门分摊成本,所以业务部门经理能够了解成本、谁在使用容量。

Grahek说:“现在你把权力从IT部门交给了”最有能力决定如何分配资源的人。消除了“虚拟服务器是免费”的观念后,Grahek对服务器虚拟化有了一个新的目标:“我们在力争实现100%虚拟化。”

《信息周刊》杂志近日对410名企业技术专业人员所作的VMware vSphere 5调查发现,大约51%的公司把一半或一半以上的工作负载进行了虚拟化处理。费埃哲后来明白,但是这也加大了复杂性,不但加大了IT运营方面的复杂性,还加大了与业务经理的相互关系方面的复杂性。

虚拟化在继续保持发展的势头:据《信息周刊》在2011年对396名企业技术专业人员所作的虚拟化管理调查显示,63%的公司计划在2012年年底之前将一半或一半以上的服务器进行虚拟化处理。生产系统一度是虚拟化技术的禁区,现在也经常采用虚拟化,以便增强管理灵活性,从而提高可用性、实现负载均衡以满足峰值要求,以及提供更容易的灾难恢复。对数据库系统进行虚拟化处理仍然很少见,尤其是对事务处理而言,但是一些公司正在大步前进。埃森哲北美基础架构和整合业务主管Jay Corn说:“对数据库系统不采用虚拟化是没有技术理由的。我们已经对甲骨文数据库服务器成功地进行了虚拟化处理。根本不存在与数据库虚拟化有关的数据问题。”

但是随着虚拟化的力度越来越大,它给整个数据中心带来了变化。一台主机服务器上运行10至20个虚拟机,会产生很大的输入/输出流量。如果那些虚拟机里面运行数据库,网络就得满足许多磁盘调用的要求,另外还有正常的存储区域网(SAN)数据存储流量和以太网通信流量。这样一来,数据中心的下一大瓶颈就有可能暴露出来。过去IT部门受制于处理器周期、甚至内存资源,而现在变成了受制于服务器边缘、输入/输出端口以及邻近的网络设备。

Corn说:“高度虚拟化的服务器仍使用遗留的网络和存储系统,结果在输入/输出方面卡住了。”这意味着,面对比较密集的虚拟机环境,千兆以太网交换设备无力满足要求;就需要升级到万兆交换设备。作为一种虚拟化资源,网络也在拖后腿;网络可能会继续拖后腿,除非出现了能够将网络当作汇集、可配置资源来处理的新一代交换机,这新一代交换机可能基于OpenFlow协议。

尽管虚拟化技术会带来复杂性,但是IT主管们决不能采取观望的态度。没错,管理软件和标准可能会改进,尤其是对跨平台虚拟化而言,跨平台虚拟化在今天是个冒险的举动。但是IT团队表明了他们现在如何能够克服技术上和组织上的问题。

极端虚拟化

Bluelock 是一家总部设在印第安纳波利斯的基础架构即服务提供商,竞争对手包括亚马逊、微软和谷歌等业界巨头。信息技术主管Aaron Branham表示,说到最大限度地提升服务器性能,他公司走在大多数公司的前头。《信息周刊》的调查发现,55%的公司每个主机运行6至20个虚拟机;而Bluelock通常每个主机运行约100个虚拟机,甚至把136个虚拟机放在一台四插座48核512 GB内存的惠普DL 585服务器上。Branham表示,该服务器运行良好。

Bluelock的业务需要同时运行好多独立的工作负载,需求又不可预测。在许多虚拟化架构中,一个虚拟机试图与另一个虚拟机进行对话,就会通过虚拟机管理程序交换机,将消息向外发送到网络上,哪怕另一个虚拟机就在同一个物理机器上的附近也是如此。

于是Bluelock与惠普和Xsigo一起构建了自己的架构,而Xsigo公司提供的Xsigo Director是一款专门用于对输入/输出进行虚拟化处理的服务器。当流量不需要向外发送到网络上,比如数据库调用磁盘、数据存储流量和虚拟机之间的通信,Director将InfiniBand连接组成一对一对,通过惠普虚拟交换机、而不是通过虚拟机管理程序的软件交换机,将流量从主机上卸载。

这样一种架构对于每个主机仅运行五六个虚拟机的环境来说可能大材小用了, 而接受调查的公司中大约五分之一每个主机运行至少21个虚拟机。随着虚拟机的数量不断增加,许多公司不得不应对这个复杂问题:数据中心的瓶颈在不断变化。高度虚拟化的服务器导致了更频繁地使用每一个相关设备,虚拟机管理员就得兼顾各方面。Branham遇到过这种情况:数据中心的某个部分:输入/输出、网络和存储系统在拖后腿,从而迫使他想方设法提升相应部分的速度。

他说:“我们在旧环境中遇到了瓶颈,iSCSI存储系统引起了各种各样的问题。”现在,每台服务器只使用两条InfiniBand线缆,外加一条比较小的100Mb管理网络线缆,而不是像以前那样用九条线缆将网卡和主机总线适配器与存储和网络交换机连接起来。每个虚拟化主机的可用带宽从500 Mbps增加到了40 Gbps,而且虚拟化输入/输出可以根据需要重新配置。

Branham的确担心一个新问题:要是服务器即将出现运行异常,他公司的冠群Nimsoft监控系统会提醒哪个部件即将出现故障,但是他仍得在灾难发生之前,将所有那些虚拟机迁移到另一台服务器上。他可以在六七分钟内,通过VMware的vMotion实时迁移功能,将一台运行100个虚拟机的服务器腾出来——如果是一台运行136个虚拟机的服务器,这个过程可能需要10分钟。

随着许多公司设计出这些更先进的虚拟架构,Branham认为有一项技能越来越重要:精确的容量规划。这项技能之前不是那么重要,因为许多公司配置过度,认为可用性比效率更重要。

但是公共云提供商和企业数据中心都越来越普遍地使用计量系统,这将使得提供正好适合任务所需要的资源成为必需,而不是非必需。Branham说:“云环境激励用户合理减少资源;你需要多少资源,就用多少。”

98%的虚拟化

将来,不是只有像Bluelock这样的高产量公共云公司才需要容量规划技能。随着大大小小的公司对生产系统进行虚拟化处理,峰值需求会让新的瓶颈暴露出来。

Raymond DeCrescente就担心这个问题,他是纽约奥尔巴尼医学中心旗下首都区整形外科中心(Capital Region Orthopaedics)的首席技术官。DeCrescente的团队为32名执行医生提供诊所管理和后台服务。他们需要AllScripts诊所管理和AdvantX外科手术中心管理系统随时可用,这套系统包括几个SQL Server数据库。该团队很快将往一系列必要软件当中添加电子病历软件。

就在一年多前,DeCrescente决定围绕一个高度虚拟化的数据中心对他的小型IT部门进行重组,希望提高效率,让他可以在20英里之外的地方建立灾难恢复中心。他说服了公司的管理层,对八套SQL Server系统和诊所管理系统进行了虚拟化处理。这些系统运行在八块思科统一计算系统(UCS)刀片和两台普通的机架M200服务器上,而这些服务器运行着28个虚拟服务器;最终将运行39个虚拟服务器。购买和实施费用花了200万美元,包括硬件、支持、VMware虚拟化软件和灾难恢复软件。

这对这家公司来说是笔大费用,但是由于每块刀片上有96GB内存和12个至强2.93GHz核心,DeCrescente有非常多的备用容量,他预计在可预见的将来不需要追加资金投入。他的SQL Server数据库运行顺畅,几乎感觉不到性能有任何下降,而且所有相互关联的部件:服务器、网络和存储系统与之前各自是独立的物理系统相比,更容易通过vCenter管理控制台来管理。这种架构让他的人员有时间来建立那个新的灾难恢复中心、测试故障切换能力以及开展其他长期被忽视的项目。

一旦DeCrescente逐步淘汰一套诊所管理系统(他将该系统与甲骨文数据库放在一台独立服务器上),他会将首都区整形外科中心环境中98%的系统进行虚拟化处理。将来只会剩下一台无法从虚拟机里面来运行的传真服务器不采用虚拟化。

DeCrescente听到了质疑声,质疑声主要来自对生产系统虚拟化持谨慎态度的软件开发商,而不是来自他公司内部。他说:“我们发现一些开发商非常担心我们对其产品尽量提高虚拟化力度。”

对大多数公司来说,什么都进行虚拟化处理并不明智。在虚拟化数据中心做到资源与需求动态精确配合仍是个挑战,这需要IT和业务部门的相关人员加大合作,才能克服这个挑战。埃森哲的Corn表示,这还需要数据——大概是一年下来的IT运营数据,才能知道某个虚拟机因不同的原因而需要多少内存及其他资源。而这种数据常常不具备,公司应该现在就要考虑评估应该收集哪些信息,才能作出虚拟化方面的下一波决策。

【51CTO.com独家译稿,未经授权谢绝转载!合作媒体转载请注明原文出处及出处!】

译文来源: http://www.informationweek.com/news/global-cio/interviews/231901240?ct=1022

【编辑推荐】

  1. 开放还是保守 虚拟化遭遇原生态
  2. Veeam:虚拟化市场面临洗牌
  3. 虚拟化失败五大诱因:实体服务器未有效运用
  4. 迎接网络虚拟化 IT人员需要做什么?
  5. 将虚拟机从VMware Workstation 8拷贝至ESXi
【责任编辑:何巍 TEL:(010)68476606】

点赞 0
分享:
大家都在看
猜你喜欢

读 书 +更多

Eclipse插件开发方法与实战

本书分为4个部分共24章,以插件开发为中心,围绕插件开发主要介绍SWT/JFace的应用、插件扩展点的实现,以及GEF、EMF和RCP的相关知识。本书...

订阅51CTO邮刊

点击这里查看样刊

订阅51CTO邮刊