现代企业数据中心为全球业务活动提供着最复杂的基础设施技术支持,但是很多数据中心基础设施设备利用率远低于百分之十和百分之十(也称之为僵尸服务器,消耗电能却不进行运算)。同时,这些设施的运营商也难以跟上计算设备的快速变化。
能耗问题、IT设备利用率等问题一直备受关注,如何让数据中心管理变得更高效?几乎所有数据中心都在采取措施以改善其运维,但是效果并不明显,也影响着数据中心去获取最大的商业价值。
斯坦福大学教授乔纳森•库米指出,保持现代数据中心业务高效运营的三大关键,它们是: 跟踪、管理制度和物理原则。
跟踪
“跟踪”是数据中心运营的关键之一。运行一个数据中心需要精确实时测量温度、湿度、气流情况,以及详细的库存设备情况以保证良好的性能。大多数数据中心使用基础设施管理工具(DCIM)通过传感器遍布每个设备以提供这些信息。起初,通常需要DCIM软件针对每一个设备定制化地确定应用程序,但随着时间的推移,情况会更加复杂。据悉,最先进的设施通常使用射频识别(RFID)技术来“标签”每一块设备, 包括每台服务器上架和在线跟踪设备的状态。每当设备移动,RFID阅读器可以帮助中心数据库跟踪、更新设备状态、甚至是更新网络连接状态。
许多数据中心管理者错误地认为,一旦他们有DCIM工具,他们只需要管理设施就够了,其实没有进一步了解到真相。其实,DCIM软件就像汽车的仪表板,可以实时管理车速和发动机温度等信息,但这样的工具(为他们提供详细的数据中心的现状) 是必要的但是不够的。
管理制度
因为在数据中心,设备是不断变化的,有时并以不可预知的方式变化。数据中心的管理需要有明确的规章制度,这些规章制度是需要长时间的经验总结而成。很多专业机构也可以提供相当大的帮助,例如劳伦斯伯克利国家实验室,绿色网格, 开放式计算项目,ITI和TBM委员会等等。
众所周知,射频识别、跟踪、收集工具和通过网络数据程序实现 (如上所述) 更容易做出精确的库存跟踪,而DCIM传感器测量可以更容易地定义数据中心的操作过程。另外,通过传感器获取的数据可以结合机器算法以使一些数据中心操作实现自动化,从而简化人们设计的规章制度。
物理原则
一直以来,物理定律的应用,工程设计和技术约束影响着电力和冷却设备的可靠传递。因为数据中心是不断变化的,使空气和热量流动存在一定的复杂性,因此有必要应用工程仿真工具(CFD)对数据中心进行设计和操作。这也意味着从跟踪工具,到信息整合,到软件模拟气流,配电和传热,现代数据中心也在不断的进步。
流体动力学计算软件的计算过程是非常复杂的,计算模型需要与实际测量的数据中心进行校准,以确保他们精确地描述设备的操作,但是一旦校准,便可以用它们来预测设备配置的变化以及对气流的影响,包括温度、效率、可靠性、可用容量和成本预算等等,包括是否需要移动或增加设备。比如有时候添加几块挡板会产生巨大的效果,这样也就能省去了空调系统的成本。
这样的工程仿真工具可以预知操作计划的成本和风险,与“跟踪”和“管理制度”一样重要。总的来说,通过这三大关键方面,可以有效帮助数据中心提高运营效率。