|
|
51CTO旗下网站
|
|
移动端

影响系统的虚拟化挑战

在现代IT中,虚拟化是行业标准。IT管理员应关注虚拟化挑战,例如无响应虚拟机、虚拟机网络延迟、巨型虚拟机、资源争用和僵尸虚拟机,以确保其虚拟系统成功运行。否则,这些系统可能面临性能低下的风险,这可能会导致严重问题。

作者:Stefani Muñoz来源:TechTarget中国|2020-01-02 10:23

在现代IT中,虚拟化是行业标准。IT管理员应关注虚拟化挑战,例如无响应虚拟机、虚拟机网络延迟、巨型虚拟机、资源争用和僵尸虚拟机,以确保其虚拟系统成功运行。否则,这些系统可能面临性能低下的风险,这可能会导致严重问题。

虚拟化为管理员提供了很多好处,例如专用服务器、快速部署和重新部署、更低的成本、更快的备份和更高的生产率。但有时候,上述挑战可能会抵消这些好处。管理员必须谨慎地监视其系统,以避免系统过载,并且,应采取特定策略(例如VM标签)来帮助缓解问题。

VM内资源争用

主要虚拟化挑战之一是存储阵列内缺乏资源,这也是VM内大多数性能问题的原因。通常,虚拟化主机具有有限的硬件资源池。因此,给定系统内的每个VM必须共享这些资源。如果虚拟机生成大量IOPS请求,则这些虚拟机可能会淹没存储阵列。

为了解决这个问题,管理员可以将VM移动到拥有足够资源的存储阵列以处理其VM。此外,管理员还可通过特定的性能监视工具,查看VM所需的IOPS数量。这些工具还可以对比管理员的工作负载与其存储硬件的功能。

通过监视他们的系统,管理员可以在出现性能问题之前转移VM,并避免资源争用。

无响应VM

锁定或无响应VM任务会导致冻结VM。在某些情况下,来宾OS也可能拒绝响应,这可能导致管理员难以停止、重新启动或关闭和开启无响应VM。VM无响应可能是出于多种原因,例如主机服务器上的存储、网络和可用资源问题。当VM冻结时,某些管理员可能会选择通过管理程序界面终止VM进程,但这应该是最后的选择。

在采取行动前,管理员应首先确定存在一个还是多个无响应的VM。如果在单台主机服务器多个VM无响应,则问题很可能是由主机服务本身引起的。如果虚拟机可通过特定接口做出响应,则管理员可以在管理程序控制台上通过检查日志或错误消息来定位问题。

当管理员缩小问题范围后,他们就可以发现导致虚拟机无响应的根本原因。如果管理员无法定位问题,则应考虑特定任务是否导致主机内的VM冻结。然后,管理员可以检查VM及其主机系统的配置,以确保有足够的资源可用。最后,管理员应检查其网络和共享存储是否支持所有VM。

虚拟机网络延迟

虚拟机需要网络访问才能运行,而延长ping响应时间等问题可能会导致性能问题,进而影响管理员系统的运作。为了解决虚拟机网络延迟,管理员必须首先排除其系统中的所有LAN问题。

网络拥塞(例如繁忙的反恶意软件)通常会导致网络延迟。管理员可能还会发现,IP冲突以及网络设备故障或配置不当会导致网络延迟。此外,虚拟处理器的过度使用可能会造成问题。当主机系统为某些VM提供的虚拟处理器数量超过所需数量时,其他VM可能没有足够的处理器时间。

当管理员确定网络延迟的原因,他们就可以将问题隔离到主机服务器硬件。例如,输入/输出系统配置不当、网络端口配置不正确以及VM驱动程序过期等问题都可能导致网络延迟。对于Windows Server环境,网络延迟的常见原因来自电源计划问题。如果电源计划设置不正确(例如设置为平衡),可能会导致性能问题。管理员应该将电源计划设置为高性能,以减少网络延迟。

巨型VM和应用程序杀手

巨型VM运行8个以上的vCPU和255 GB的虚拟RAM,通常管理员使用它们来运行需要大量CPU和内存资源的应用程序。但是由于资源调度问题,巨型VM也可能导致性能问题。为了更好地管理巨型虚拟机,管理员必须参考vRealize Operations(vROps)、CPU和内存需求指标以对巨型虚拟机进行调整。

此外,虚拟系统可能包含多个性能杀手,这些性能杀手会严重影响应用程序的运行。如果管理员遇到性能延迟,则可以采取自上而下的方法来找出问题,从应用程序堆栈开始,然后向下移至OS堆栈、VM堆栈、ESXi堆栈,最后是基础架构。管理员找出问题后,便可以使用ESXi命令行和vROp等工具来修复性能问题。

僵尸虚拟机和VM蔓延

僵尸VM不会执行任何有用的任务,但是会消耗宝贵的系统资源。基本上,管理员在弃用一个虚拟机时会创建一个僵尸虚拟机。自动化是现代IT的重要组成部分,管理员现在可以自动创建大量VM。因此,管理员可能无法跟踪系统中的VM,而这可能导致虚拟化蔓延(VM sprawl)。

跟踪这些僵尸VM并减少VM蔓延是很困难的工作,不过,管理员可以使用VM标签更轻松地跟踪VM。管理员创建虚拟机后,可将独特标签附加到每个虚拟机上,以帮助确定虚拟机的确切用途。如果管理员在创建VM时没有使用VM标签,则他们必须监视整个系统的异常性能行为。例如,如果管理员注意到其系统的CPU、内存和网络内部的性能问题,则可能表明僵尸VM和VM蔓延。

但是管理员不应立即终止所有虚拟机。Backup Active Directory控制器和域名系统服务器不会一直保持活动状态。管理员必须密切监视其系统,在确定存在僵尸虚拟机后,他们应断开虚拟机与网络的连接,并将虚拟机移动到磁盘上来测试虚拟机,以确保它们不会产生负面影响。

【编辑推荐】

  1. 一文理解JVM虚拟机(内存、垃圾回收、性能优化)解决面试中遇到问题
  2. JVM调优的反思与总结
  3. 了解JVM的结构,好在面试时吹牛
  4. 关于Jvm类加载机制,这一篇就够了
  5. VMware:推进创新生态建设,赋能企业的数字化转型
【责任编辑:武晓燕 TEL:(010)68476606】

点赞 0
分享:
大家都在看
猜你喜欢

订阅专栏+更多

云架构师修炼手册

云架构师修炼手册

云架构师的必备技能
共3章 | Allen在路上

21人订阅学习

Devops之监控神器Prometheus

Devops之监控神器Prometheus

监控主流
共22章 | 小罗ge11

172人订阅学习

手把手玩转Elasticsearch

手把手玩转Elasticsearch

Chandler_珏瑜
共20章 | Chandler_珏瑜

80人订阅学习

读 书 +更多

C# 2005 & .NET 3.0高级编程(第5版)

该书为C#经典名著!是Wrox红皮书中最畅销的品种之一。从第1版开始就名满天下;其第3版被评选为2005年最权威的十大IT图书之一;并荣获“2005...

订阅51CTO邮刊

点击这里查看样刊

订阅51CTO邮刊

51CTO服务号

51CTO官微