随着AI技术的广泛应用,从智能手机到自动驾驶汽车,从智能家居到工业自动化,AI供电芯片的需求量正呈爆炸式增长。这些芯片不仅为AI系统提供稳定的电力供应,确保系统的正常运行,还承担着节能减排、降低能耗的重任。然而,随着算力需求的提升,AI设备在散热等方面的问题日益凸显,给AI供电芯片带来了新的挑战。如何实现高效率、低功耗、持续稳定的供电成为了业界关注的焦点。
首先,能耗问题愈发严峻。算力核心设备由传统的CPU向GPU转移,虽然提升了计算效率,但高性能往往伴随着高能耗。在追求更快计算速度的同时,GPU的能耗也在不断上升,给数据中心和服务器带来了巨大的能源压力。据研究显示,到2027年,整个人工智能行业每年将消耗85至134太瓦时的电力。
其次,散热问题成为挑战。高性能的AI芯片在运行过程中会产生大量热量,如果不能及时有效地散热,不仅会影响设备的稳定运行,还可能缩短其使用寿命,制约AI算力的进一步增长。未来,单颗高性能AI芯片的热设计功耗将突破1000W,达到传统风冷散热的极限。因此,探索更有效的散热解决方案成为关键。
此外,可靠性问题也不容忽视。AI应用对芯片的性能与要求非常高。为了完成一个大模型的训练任务,通常需要几千张甚至几万张计算卡进行级联,提供充足的算力。如果有一张卡出了问题,整个大模型的训练都会受到影响。因此,如何确保芯片的稳定性和可靠性成为了一个重要课题。
针对以上问题,MPS AI电源解决方案在多个方面取得了突破。首先,其体量更紧凑、功率密度更高、配电损耗更低。MPS的AI电源方案采用创新设计,使数据中心在给定机柜范围内的计算能力得以提升。相比竞争对手的方案,MPS的功率转换技术在主板上占用的空间更小,所有处理器能更紧密地结合为一体,在更小的空间内实现更强的计算能力。
其次,电源转换效率更高、顶部散热设计兼容液冷。为了解决高功率密度电源模块中的散热问题,MPS优化了内部结构和器件设计,提升了电源转换效率,降低了功耗和热量产生。同时,将模块做成顶部散热设计方便散热器设计器件还能兼容液冷应用借助液冷增强服务器散热效果从而进一步发挥电源的极致性能使单机柜功率大幅提升。
此外MPS在仿真计算和出厂测试方面也做出了努力。通过严密的仿真计算和严格的出厂测试确保了AI芯片批量的一致性和可靠性。在设计阶段MPS会通过仿真和理论计算确定所有器件的工作条件从而选取合适的电子器件。而在研发阶段则采用不同批次的模块产品进行可靠性实验出厂前会逐项测试模块电气性能及参数最后还会进行老化测试及前后参数对比分析。
最后MPS还提供实用的仿真工具、专业的技术支持和灵活的供应链管理帮助客户更省时、更安心地设计方案。其提供的PDN仿真工具、仿真模型、灵活的GUI等前期评估工具在前期和后期都能协助客户进行方案测试确保精准落地。同时其工程师也将全程提供专业的技术支持帮助客户及时解决实际应用中遇到的难题。另外采用供应链multi-source管理提高供应链的灵活性和自主性优化生产工艺以保证充足的产能支撑AI对芯片大规模用量的需求。