讲述:一个VMware维护人员每天、每周及每月的工作

云计算 虚拟化
有时,VMware管理员如走过场一样执行日常维护任务。他们做X、检查Y然后把把Z的脉搏。但是很重要的一点是要弄明白这么做的目的。

有时,VMware管理员如走过场一样执行日常维护任务。他们做X、检查Y然后把把Z的脉搏。但是很重要的一点是要弄明白这么做的目的。

维护工作不仅仅是要维持系统在线,它同样保证您可以从现有投资中获得最大收益。虽然ESX、vSphere、vCenter和Workstation都是成熟和稳定的虚拟化技术,但是它们依然需要进行日常维护。

花费一些时间去了解您的架构,然后制定VMware维护计划以满足您的SLA(service level agreement)级别并尽量减少工作压力。下面的纲要中包含了一些最佳实践,但是每个虚拟化架构各有不同,您需要选择最适合的方式。

VMware维护工作根据频率可以大致分解为:每天、每周和每月。

VMware日常维护工作

我每天要进行的维护工作如下:

◇ 查看报警邮件。邮箱监控是一种持续的、被动的、而且一旦正确设置后不需花费很多精力的监控方式。当您逐渐熟悉系统架构后,还可以区分出警报的不同类型,识别哪些是紧急的需要立即处理,哪些是需要逐步去改变的。
假设某个特定的数据库在每天的固定时间发送CPU占用率过高的警报,那么最好调节一下报警设置的条件和频率。不要忘了《狼来了》的故事,避免因为过多无关紧要的警报而忽略了那些关键问题。

◇ 巡视服务器所在的房间。虽然我也设置了警报,但通过对主机所在的房间进行一次快速的巡视我可以马上判断出发生了什么,这非常有用,尤其是忽略了某个警报的时候可以补救。
所有的风扇都在运行吗?是否出现内存差错?SAN系统中的磁盘驱动器正常吗?通过观察硬件上的指示灯我可以获得基本的状态信息。我还会快速检查一下不间断电源的供电电压,以及现在的运行时间。知道了这些,一旦发生灾难,我可以知道有多少时间可用来关闭设备。除了这些快速观察外,我还经常使用HP公司在宿主机上集成的Lights-Out端口来检测硬件状态和温度,尤其在没有物理登陆宿主机或SAN的时候,这么做非常有必要。

◇ 环视一圈vCenter/VirtualCenter。我会执行所有还未完成的任务,瞥一眼ESX主机的性能然后感受一下各个组件是否正常。当您对系统每天的性能表现足够熟悉的时候,就很容易看出问题。相信我,无论系统看起来多么协调,在某些时候都会出现问题。这个过程如同您很熟悉自己在静止时的心跳,同时还需要通过跑步机或骑自行车来定期检验一下。

VMware每周维护工作

每周我会执行如下动作:

◇ 备份vCenter/VirtualCenter数据库。我的现有系统变化不太频繁,因此一周执行一次数据库清理和管理服务器的全备份就可以了。如果您的系统处于不断地动态变化中,可以频率高一些。依然要强调那个老问题:如果您希望将来可以重建,拥有数据库的备份很重要。

VMware每月维护工作

每月我们进行如下的管理行为:

◇ 清理存储。如果存在过期的快照,最好尽快清理掉。如果无法确定是否存在,可以通过VMware SiteSurvey查看。

◇ 检查服务协议。您是否已经升级了售后服务?到了做新的预算来购买所需支持服务的时候了吗?

◇ 预想将来要做的升级。目前为止,所有的工作都在围绕保持系统正常工作上。让我们向后一步,闭上眼睛不妨从相反的角度来考虑:您希望系统如何工作?怎样可以改善业务?然后找出一条正确的路来实现。这听起来像在做白日梦,不过或许这会成为您一天中最高效的一段时间。

【编辑推荐】

  1. 思杰、VMware应用虚拟化能否对抗微软?
  2. 甲骨文松口 支持在VMware上运行RAC
  3. 这是真的吗 VMware将支持Hyper-V?

责任编辑:王勇 来源: TechTarget中国
相关推荐

2014-12-23 14:32:42

程序

2009-07-15 09:24:08

2012-08-24 10:46:12

程序员

2009-12-31 14:35:16

ADO缺点

2020-03-17 08:19:31

智能工厂物联网预测性维护

2020-06-01 12:47:12

戴尔

2011-08-04 11:14:34

2009-08-21 15:56:31

安装VMWare To

2011-03-10 15:33:54

Debian社区

2022-04-30 17:15:45

Retool软件工程师开发者

2021-06-07 09:00:20

开源技术 代码

2010-01-13 10:31:35

C++代码

2020-07-12 15:24:55

人工智能技术疫情

2018-06-23 08:02:31

程序员代码故事

2015-10-14 10:45:04

linux命令less

2012-12-26 16:13:41

毕业生

2023-10-11 07:56:52

Linux代码基金会

2020-06-12 16:17:30

AI疫情人工智能

2009-07-14 21:41:10

数据中心计算机系统

2020-02-24 10:52:42

物联网电梯安全
点赞
收藏

51CTO技术栈公众号