使用 NTC 热敏电阻监控 AI 数据中心的温度
投稿人:DigiKey 北美编辑
2025-09-04
随着人工智能 (AI) 需求的增加和功率密度的提高,数据中心面临着前所未有的热管理挑战。需要进行精确的实时温度监测,以优化性能和效率,同时防止过热。这些检测解决方案必须准确、反应灵敏、坚固耐用,能欧应对高灵敏度设备上快速变化的热负载。
本文将探讨现代 AI 数据中心设计人员所面临的热管理挑战,详细分析各种冷却系统,包括空调、浸没式冷却和热管理解决方案。然后,介绍 EPCOS (TDK) 的负温度系数 (NTC) 热敏电阻解决方案,并说明如何利用这些解决方案来应对热管理挑战。
为什么 AI 数据中心会带来新的热管理挑战?
图形处理器 (GPU) 和张量处理单元 (TPU) 等 AI 硬件通常比传统中央处理器 (CPU) 耗电量大得多。因此,以 AI 为重点的数据中心往往具有相当高的功率密度,而且热点集中,难以用传统的冷却方法进行管理。
更糟糕的是,AI 工作负载往往变化很大,在强化训练或推理操作期间,热负载有可能迅速攀升。如果不进行适当的热管理,这些情况可能会导致性能降频、计划外停机和硬件加速退化。
为了满足这些新出现的需求,就要为数据中心采用更先进的冷却方法。直连芯片冷却是一种常见的冷却法。这种技术将冷却管、冷板或热交换器直接对准 CPU、GPU 和内存等大功率器件。此外,还可选择浸没式冷却法,具体做法是将整台服务器都浸没在非导电液体中。
空调也在进行各种升级。例如,行间制冷单元及机柜内置冷却单元,可在整体机房空调系统基础上提供区域冷却,即实时响应局部过热问题。
尽管这些冷却系统的具体条件各不相同,但都在推动对分布更广、反应更快的温度监控的需求。本文以直连芯片冷却系统为例。每个目标芯片都需要安装散热片传感器,以确保维持温度标准。需要通过管道安装式传感器来监控冷却液的流入量,还需要在冷却液分配装置和热交换器上安装其他传感器,以确保系统高效运行。
NTC 热敏电阻传感器在数据中心应用中的优势
NTC 热敏电阻可满足所有这些要求。顾名思义,NTC 传感器的电阻会随着温度的升高而下降。就 NTC 热敏电阻而言,这是通过一个封闭在保护性金属或环氧树脂外壳中的小型热敏氧化陶瓷元件来实现的。
图 1 所示为额定电阻为 2 - 5 kΩ 的热敏电阻在 25°C 时典型的温度电阻的曲线。如图所示,电阻越大,热敏电阻越适合高温应用,因为电阻的变化更容易测量。
图 1:所示为额定值为 2 kΩ 至 5 kΩ 的热敏电阻在 25°C 时的典型温度电阻曲线。(图片来源:EPCOS (TDK))
NTC 热敏电阻为 AI 数据中心带来的优势包括
- 精度高,响应快:对轻微的温度变化极为敏感,由于热质量小,因此响应速度快。这些特征使得 NTC 热敏电阻能够很好地满足 AI 数据中心快速波动的热需求。
- 耐用性和稳定性:由坚固型材料制成,具有出色的长期可靠性,随着时间的推移,电阻漂移极小。这种稳定性最大限度地降低了维护需求,减少了意外停机风险。
- 体积小巧,安装灵活:体积小,可轻松集成到空间有限的器件密集的数据中心环境中。具有多种外形,可满足人工智能数据中心冷却系统的各种需求。
EPCOS NTC 热敏电阻系列充分体现了这些优势。该产品系列包括用于监控散热器和管道、浸没式冷却系统以及空气处理装置的解决方案。
使用安装在散热器上的 NTC 热敏电阻监测大功率元件
GPU 和 TPU 等大功率处理器需要严密的热监控,以保持性能并防止过热。B57703M0103G040 (图 2) 用于直接安装在散热器上,因此非常适合这项任务。这种螺钉固定式传感器将一个 NTC 热敏电阻封装在带突出环耳的金属标签外壳中。
图 2:B57703M0103G040 环形接线片式热敏电阻可实现对大功率处理器散热器的精确温度监控。(图片来源:EPCOS (TDK))
螺钉固定式传感器设计既方便又重要,可确保与散热器表面良好的热耦合和一致的接触压力,从而在负载快速变化时降低热阻并提高测量精度。
该传感器通过了 +70°C 温度条件下的 10,000 小时的长期稳定性测试,可在 AI 数据中心工作负载中常见的高温条件下使用。该传感器在 +25°C 时的额定电阻为 10 kΩ,为测量更高的工作温度提供了可靠的基础,从而为温控系统提供准确的反馈。
使用 NTC 热敏电阻监测液体冷却管道
液冷系统依赖于持续供应适当温度的冷却液。B58100A0506A000 (图 3) 是一款 10 kΩ NTC 热敏电阻,可快速安装在管道上,是监控冷却液供应管路的理想之选。这种模制组件可直接夹在直径为 18 mm 至 19 mm 的管道上,也可根据不同的安装情况适应其他尺寸的管道。内置的凸片式触头可直接连接监控设备。
图 3:B58100A0506A000 夹式热敏电阻可测量液冷系统中的冷却液温度。(图片来源:EPCOS (TDK))
对外部管道温度的监测,为跟踪冷却液性能提供了一种准确、方便的维护方法,而无需将传感器直接浸入液体中。这种方法最大限度地降低了安装复杂性,减少了泄漏风险,并能根据需要快速更换传感器。
热时间常数也称为热响应时间,是温度传感器的一个关键性能参数,它反映了 NTC 热敏电阻器的电阻随外部温度波动而变化的速度。该参数由传感器设计、安装配置和周围环境决定。
例如,B58100A0506A000 使用铜外壳使传感器与管道热耦合,在管道上测量的热时间常数小于 5 s。这种快速响应时间有助于确保可靠的冷却液供应。
使用 NTC 热敏电阻监测冷却液分配系统
除了监控热源和冷却液供应管路外,液冷系统还需要对冷却液分配装置、热交换器和其他中央组件检测温度。B57800K0103A001 器件(图 4)很好地满足了这些要求,其圆柱形铜外壳具有出色的导热性,能够准确地测量系统关键点的流体温度。
图 4:B57800K0103A001 圆柱形探头热敏电阻可用于监测冷却液分配系统中的冷却液温度。(图片来源:EPCOS (TDK))
这款 10 kΩ 传感器的工作温度可达 +150°C ,可将其置于发热侧但不会有过热风险。该传感器在水中的热时间常数约为 8 s,能够以足够快的速度跟踪冷却液温度的变化,从而实现系统级控制和保护。
在这些组件的入口和出口处安装传感器,有助于操作人员跟踪热交换器或冷却液分配回路的温差。如出现重大偏差,则表明可能存在冷却液流量减少、出现部分堵塞或热交换器表面出现污垢等问题,因此操作人员可进行预防性维护,防止在系统性能受到影响。
使用 NTC 热敏电阻监测浸没式冷却系统
浸入式冷却系统将服务器浸入介电油等非导电液体中,因此传感器必须能够耐受可能出现的腐蚀。B57504K0103A009 (图 5) 是一款专用于此类环境的 10 kΩ 传感器,其不锈钢外壳能够长期耐受轻度的腐蚀性物质环境,同时确保与检测元件之间有效的热耦合。
图 5:B57504K0103A009 不锈钢探头热敏电阻可监测浸没式冷却系统中的冷却液温度。(图片来源:EPCOS (TDK) )
这种传感器在水中的热时间常数小于 2 s,可精确跟踪浸没槽内的温度变化。
使用 NTC 热敏电阻监控空调系统
最后,请看 B57500M0103A005 器件(图 6)。这款 10 kΩ 器件采用简单的环氧树脂封装,外形小巧,配有 470 mm 导线,有助于灵活布线。例如,由于体积小、导线长,因此可以安装在蒸发器盘管附近或风道内,实现快速检测温度变化,这有助于保持稳定的气候控制。
图 6:B57500M0103A005 环氧树脂封装热敏电阻可监控空调系统。(图片来源:EPCOS (TDK))
除其他优点外,该传感器还能耐受振动、快速温度循环和 AC 系统中常见的其他危险,而不会造成物理损坏或对测量精度产生重大影响。
结语
AI 工作负载迫切需要在数据中心内进行分布式温度监控。EPCOS (TDK) 的 NTC 热敏电阻系列可用于散热器、冷却管、浸没式水浴槽、空气处理装置等,在苛刻的环境中可靠、灵敏地工作。
免责声明:各个作者和/或论坛参与者在本网站发表的观点、看法和意见不代表 DigiKey 的观点、看法和意见,也不代表 DigiKey 官方政策。



