AI提升数据中心的可用性和效率
机器学习为数据中心运营商带来了更好的散热,功耗和性能。 随着企业开始采用经过大型数据中心运营商和托管服务提供商试用和测试过的机器学习技术,人工智能将在数据中心运营中扮演更重要的角色。 今天的混合计算环境通常跨越了内部数据中心、云和配置站点以及边缘计算。企业发现传统的数据中心管理方法并不是最优的。通过使用人工智能,机器学习,可以简化复杂计算设施的管理。 目前,数据中心的AI主要围绕机器学习来监控和自动化设施组件的管理,如电力和配电元件,冷却基础设施,机架系统和物理安全。 在数据中心设施内部,越来越多的传感器正在从设备(包括备用电源,配电设备,开关设备和冷却器)收集数据。有关这些设备及其环境的数据将通过机器学习算法进行分析,例如,该算法可以详细了解性能和容量,并确定适当的响应,更改设置或发送警报。随着条件的变化,机器学习系统能从变化中不断学习 - 它本质上是通过训练进行自我调整,而不是依靠特定的编程指令来执行其任务。 目标是使数据中心运营商能够提高设施的可靠性和效率,并更自主地运行它们。但是,获取数据并不是一项简单的任务。 基本要求是获得来自主要组件的实时数据,施耐德电气数据中心全球解决方案高级总监Steve Carlini说。包括冷水机组,冷却塔,空气处理机,风机等等设备。在IT设备方面,你需要收集诸如服务器利用率,温度和功耗等指标。 “计量一个数据中心不是一件容易的事。”Carlini说, “如果你想尝试做人工智能,你需要从数据中心获取数据,并且确保在数据中心有很多连接点用于供电和散热。” IT专业人员习惯于设备监控和实时警报,但在房屋设施方面则没有这个传统。“人们希望即时得到IT设备的通知。但在你的电力系统上,这不是直接能够得到的数据,”Carlini说。 “这是一个不同的世界。” 只有在过去的十年左右,第一批数据中心才完全装备了仪器,并使用仪表来监控电力和制冷。只要存在计量的地方,标准化的实现往往都是困难的:数据中心运营商依赖于使用多种通信协议来构建管理系统——从Modbus和BACnet到LONworks和Niagara——它们必须满足于那些无法共享数据或不能通过远程控制操作的设备。“TCP/IP,以太网连接——这些连接以前在动力系统端和冷却端是闻所未闻的,”Carlini说。 好消息是,数据中心的监控正在向高级分析和机器学习所需的深度发展。服务提供商和托管服务提供商一直非常擅长在机架级别进行监控,特别是监控能源使用情况。企业正在开始部署它,这取决于数据中心的规模,“Carlini说。 机器学习使数据中心时刻保持凉爽 由于电力系统故障导致的达美航空数据中心停运事件,使其在2016年的三天时间内停飞约2000次航班,造成损失1.5亿美元。这正是基于机器学习的自动化技术可以避免的场景。 由于数据中心计量技术的进步以及云中数据池的出现,智能系统有可能以手动流程无法发现的方式发现数据中心运行中的漏洞并提高效率。 机器学习驱动智能的一个简单示例是基于条件的维护策略,它应用于数据中心中的消耗品,例如,冷却过滤器。Carlini说,通过监测通过多个过滤器的空气流量,智能系统可以检测出一些过滤器是否比其他过滤器堵塞更多,然后将空气导向堵塞较少的单元,直到需要更换所有过滤器为止。 另一个例子是监控UPS系统中电池的温度和放电。智能系统可识别在较热环境中运行且可能比其他系统更频繁运行的UPS系统,然后将其指定为备用UPS而不是主系统。 “它可以为你做一些思考。这原本是需要手动完成的,但现在机器也可以做到。这些是基本的案例,”Carlini说。 更高层次的功能是动态冷却优化,这是当今数据中心中最常见的机器学习的例子之一,特别是在较大的数据中心操作人员和托管服务提供商之间。 通过动态冷却优化,数据中心管理人员可以根据环境条件监控和控制设施的冷却基础设施。当设备移动或计算流量激增时,建筑物内的热负荷也会发生变化。动态调整冷却输出以转移热负荷可帮助消除不必要的制冷量并降低运营成本。 451 Research数据中心技术和生态高效IT频道的研究主管Rhonda Ascierto说,托管服务提供商是动态冷却优化的主要采用者。“机器学习对数据中心来说并不陌生,”Ascierto说。 “在很长一段时间内人们都试图根据容量和需求来改善散热,机器学习可以让你实时做到这一点。” Vigilent是动态冷却优化领域的领导者。其技术可以优化数据中心设施的气流,自动发现并消除热点。 Vigilent的创始人,总裁兼首席技术官Cliff Federspiel说,数据中心运营商之前倾向于运行比他们所需要的更多的冷却设备。 “它通常会产生半可接受的温度分布,且成本非常高。” 如果有热点,传统的措施是增加更多的冷却能力。实际上,较高的空气速度会产生压力差,干扰穿过设备的空气流动或妨碍热空气返回到冷却设备。可能这不是直觉,有时候降低风扇速度可能更有效。 Vigilent的基于机器学习的技术可以了解哪些气流设置可以优化每个客户的散热环境。该公司表示,提供适当的冷却量在需要的地方,通常能使冷却能耗降低40%. 除了自动化冷却系统之外,Vigilent的软件还允许客户使用分析工具来对其设施进行运营决策。 Federspiel说:“我们的客户越来越有兴趣利用这些数据来帮助管理他们的资本支出、能力规划和可靠性计划。这为数据中心内的大量新型的数据相关的决策创造了机会。” AI使现有流程更完善 展望未来,数据中心运营商正在努力将动态制冷优化的成功扩展到其他领域。一般来说,适合机器学习的领域是那些需要大量重复性的工作的地方。 Ascierto表示:“新的基于机器学习的数据中心方法很可能会应用于现有的业务流程,因为当您彻底了解业务问题和规则时,机器学习会表现的更好。” 企业已经有一些在使用中的监控工具。有一种长期存在的数据中心基础设施管理(DCIM)软件,可以为数据中心资产、相互依赖性、性能和容量提供可见性。DCIM软件具有远程设备监控,电力和环境监控,IT资产管理,数据管理和报告等功能。企业使用DCIM软件来简化容量规划和资源分配,并确保尽可能高效地使用电力,设备和占地面积。 “如果你有一个基本的监控和资产管理,你的预测能力将会大大提高,”Ascierto说。 “人们已经在使用他们自己的数据。” 接下来的目标是:将外部数据添加到DCIM组合中。这就是机器学习发挥关键作用的地方。 (编辑:ASP站长网) |