本文版权为《邮电设计技术》所有,如需转载请联系《邮电设计技术》编辑部
摘 要:机房内部气流组织的合理性关系到数据中心制冷系统的能耗、IT设备的性能和热环境的安全。传统气流组织模拟性能一般在小时级,使用场景受限,难以满足实时运营对机房温度场预测的时效性需求。提出一种基于Transformer的机房三维温度场快速重构和预测方法,通过融合深度学习模型与传统 CFD,将气流组织预测时间降低至分秒级,全局平均预测精度误差控制在 5% 以内,从而使 CFD 仿真有效地从设计阶段应用到运维阶段,支撑数据中心的智慧运营业务。
关键词:数据中心;温度场预测;Transformer;机器学习;计算流体力学
doi:10.12045/j.issn.1007-3043.2024.10.001
概述
随着物联网、大数据以及人工智能等新一代信息技术的推进和发展,全社会数字经济蓬勃发展,算力需求日益增长。据中国算力平台统计测算,2023年中国算力市场规模平均增速达到 30%,同时数据中心用电量约为1500亿 kWh,占全社会用电量的 1.6%。预计到 2030 年,我国数据中心能耗总量将超过4000亿 kWh。近年来,为了推进数据中心等重点设施的绿色低碳升级,工信部等国家部门制定了相关政策,要求到2025年全国新建大型、超大型数据中心的PUE降到 1.3 以下,改建核心机房降到 1.3 以下,数据中心的节能降碳面临巨大挑战。
数据中心冷却系统占数据中心总能耗的 30%~55%,由于数据中心各机房空间布局复杂,气流组织可能存在分布不均匀、冷热气流混掺等问题,进而导致冷却效果不佳,带来持续的能源浪费。通过人工测量、现场布置温度传感器等实验测量方法可以捕捉局部热点,但受限于空间和成本问题,难以获取机房全局的温度场信息。利用计算流体力学(ComputationalFluid Dynamics,CFD)的方法,可有效地计算模拟出特定条件的机房温度场三维分布,从而为提高冷却效能提供参考。
然而,传统的 CFD技术通常需要进行复杂的数值模拟和计算,耗费大量的计算资源与时间,针对数据中心机房气流组织的性能模拟通常需要小时级的时间成本,使用场景受限,难以满足数据中心实时运营阶段对于仿真数据的时效性需求。随着信息技术的发展,大量数据可被收集和积累,智能预测模型的快速性优势日益凸显。部分研究尝试将机器学习方法与传统CFD仿真技术结合,在给定的边界条件以及初始条件下,利用机器学习方法对流体域的三维温度场进行快速重构,从而实现温度场等物理量的智能预测。近年来,智能预测模型主要采用卷积神经网络、生成对抗网络、自编码器等方法。考虑到数据中心机房智能预测具备时序性强、复杂构型和强非线性的特点,上述方式的效果有限,亟需研发针对数据中心机房的三维温度场智能预测方法。
Transformer 通过将注意力引入到自编码器模型中,允许模型在解码时关注输入序列的不同部分,可以有效提升模型性能。Transformer 摒弃了 RNN 和CNN的结构,依赖于自注意力机制和残差前馈神经网络,在自然语言处理领域获得了广泛关注和应用。Transformer在处理长程依赖、并行计算、任务适应性和稳定性等方面具有一定的优势,其自注意力、上下文建模等机制不仅可以有效地捕捉复杂机房空间特征中的全局温度场趋势,还能关注到关键的局部热点信息。因此,本文基于 Transformer 深度学习模型和架构,通过对机房三维温度场信息的挖掘和学习,实现对数据中心三维温度场的快速重构和智能预测,为数据中心的智慧运营提供技术支撑。