?液冷變負(fù)載下MOS管的結(jié)溫預(yù)測(cè)算法
在液冷散熱已成為高功率AI服務(wù)器標(biāo)配的今天,其內(nèi)部的電源模塊正面臨著一項(xiàng)比穩(wěn)態(tài)散熱更為復(fù)雜的挑戰(zhàn):如何精準(zhǔn)預(yù)測(cè)在AI芯片算力劇烈波動(dòng)、負(fù)載瞬間躍遷時(shí),核心功率開(kāi)關(guān)器件MOS管的結(jié)溫動(dòng)態(tài)變化。結(jié)溫的瞬時(shí)峰值,而非平均溫度,往往是決定MOS管長(zhǎng)期可靠性的關(guān)鍵。對(duì)于專注工業(yè)級(jí)液冷應(yīng)用的平尚科技而言,構(gòu)建一套精準(zhǔn)的結(jié)溫預(yù)測(cè)算法,不僅是熱設(shè)計(jì)的關(guān)鍵,更是實(shí)現(xiàn)電源系統(tǒng)智能化管理與壽命預(yù)測(cè)的基石。AI訓(xùn)練與推理任務(wù)導(dǎo)致電源負(fù)載呈現(xiàn)快速、大幅度的變化,這意味著MOS管的功率損耗(包括導(dǎo)通損耗與高速開(kāi)關(guān)損耗)并非恒定。傳統(tǒng)的、基于最壞穩(wěn)態(tài)工況的簡(jiǎn)單熱估算法在此場(chǎng)景下已然失效,極易低估瞬時(shí)熱應(yīng)力。而MOS管的封裝形式,是決定其散熱能力、進(jìn)而影響算法精度的首要物理因素。從傳統(tǒng)的TO系列(熱阻約50-80°C/W)、到面向高頻的QFN封裝(通過(guò)底部大面積焊盤提升散熱),再到允許頂部散熱的TOLT等先進(jìn)封裝,其核心演進(jìn)邏輯就是不斷降低熱阻、優(yōu)化導(dǎo)熱路徑。在液冷環(huán)境中,這一趨勢(shì)被進(jìn)一步放大。例如,平尚科技應(yīng)用于浸沒(méi)式液冷的雙面散熱MOS管,通過(guò)“三明治”封裝結(jié)構(gòu)讓芯片熱量可同時(shí)向上、下兩個(gè)方向?qū)С觯浣Y(jié)到環(huán)境的熱阻(RθJA)可較傳統(tǒng)單面散熱封裝降低超過(guò)50%,達(dá)到15°C/W甚至更低的水平。這種封裝革新,直接改變了后續(xù)熱模型的基礎(chǔ)參數(shù)。

基于物理的結(jié)溫預(yù)測(cè)算法,本質(zhì)是構(gòu)建一個(gè)動(dòng)態(tài)的“熱阻-熱容”網(wǎng)絡(luò)模型(即熱等效電路),以實(shí)時(shí)求解芯片結(jié)溫(Tj)。其核心輸入是實(shí)時(shí)計(jì)算的MOS管功率損耗(P_loss),核心參數(shù)則是從芯片結(jié)(Junction)到冷卻液(Liquid)的總熱阻(RθJL)及各路徑熱容。該算法模型通常包含以下幾個(gè)層次:- 封裝內(nèi)部熱阻(RθJC):由封裝本身決定?。先進(jìn)的貼片封裝(如DFN、QFN)能將此值做得很低,使熱量更高效地傳至外殼或焊盤。
- 界面熱阻與外部熱阻:這是液冷系統(tǒng)設(shè)計(jì)?的重點(diǎn)。包括導(dǎo)熱界面材料、冷板金屬基體、以及最終與冷卻液交換的熱阻。在平尚科技為邊緣AI設(shè)備設(shè)計(jì)的緊湊型方案中,通過(guò)將MOS管直接安裝在集成微流道的冷板上,可將從結(jié)到冷卻液的總熱阻(RθJL)優(yōu)化至5-10°C/W的范圍內(nèi)。
- 熱容參數(shù):它表征了各結(jié)構(gòu)部件儲(chǔ)存?熱量的能力,決定了溫度變化的慣性。正是熱容的存在,使得在負(fù)載突增時(shí)結(jié)溫會(huì)快速上升,而非階躍突變。
綜合上述參數(shù),算法的實(shí)時(shí)運(yùn)算可以簡(jiǎn)化為:Tj(t) = Ta + [P_loss(t) * RθJL] + (由熱容影響的動(dòng)態(tài)項(xiàng))。更為精確的模型(如Foster或Cauer模型)會(huì)采用多階RC網(wǎng)絡(luò)來(lái)擬合這一物理過(guò)程,其參數(shù)可從器件數(shù)據(jù)手冊(cè)或?qū)嶒?yàn)測(cè)試中獲得。在實(shí)際的工業(yè)級(jí)液冷AI電源項(xiàng)目中,平尚科技將這一算法模型嵌入到電源管理單元中。通過(guò)實(shí)時(shí)監(jiān)測(cè)輸入電壓、輸出電流及開(kāi)關(guān)頻率,算法能夠在線估算MOS管的瞬時(shí)功耗,并結(jié)合預(yù)置的熱模型參數(shù),持續(xù)預(yù)測(cè)結(jié)溫變化。

這一預(yù)測(cè)能力帶來(lái)了直接的系統(tǒng)收益。首先,它實(shí)現(xiàn)了前瞻性保護(hù)。當(dāng)預(yù)測(cè)結(jié)溫接近安全閾值(如125℃)時(shí),系統(tǒng)可主動(dòng)采取降頻或限流措施,避免器件因過(guò)熱而硬失效。其次,它助力壽命預(yù)測(cè)與健康管理。基于結(jié)溫時(shí)間序列數(shù)據(jù),結(jié)合如阿倫尼烏斯加速模型,可以評(píng)估MOS管的熱老化程度,為預(yù)測(cè)性維護(hù)提供數(shù)據(jù)支持。因此,液冷變負(fù)載下的MOS管結(jié)溫預(yù)測(cè)算法,絕非一個(gè)離地的理論課題。它是連接電氣設(shè)計(jì)、封裝技術(shù)、熱力學(xué)與系統(tǒng)控制的工程橋梁。平尚科技通過(guò)融合先進(jìn)的封裝選型、精確的系統(tǒng)熱建模與實(shí)時(shí)算法,將結(jié)溫從不可見(jiàn)的設(shè)計(jì)后端,轉(zhuǎn)變?yōu)榭深A(yù)測(cè)、可管理的核心參數(shù),從而為高可靠、高功率密度的液冷AI電源保駕護(hù)航。