高效能計算市場大漲,不起眼的元器件價值量提升8倍

首頁 > 科技

高效能計算市場大漲,不起眼的元器件價值量提升8倍

來源:明星潮流 釋出時間:2024-03-29 01:51

高效能計算市場大漲,不起眼的元器件價值量提升8倍

​隨著高效能計算(HPC)系統,特別是AI伺服器的市場規模不斷擴大,其核心處理器,包括CPU、GPU、NPU、ASIC、FPGA等,以及記憶體、網路通訊等晶片元器件的效能和功耗水平都在提升。隨著效能提升,功率管理水平的提升顯得更加重要,因為HPC系統,特別是AI伺服器的耗電量越來越大,對整個系統,以及主要晶片的功率管理能力提出了更高要求。

在AI伺服器中,CPU需要供電,GPU板卡需要供電,記憶體(DDR4、DDR5、HBM)需要供電,各種介面也需要供電。此時,電源管理系統就顯得非常重要了,除了AC/DC電源、DC/DC轉換器等,電源管理系統當中用到的無源器件(以電感和電容為主)也發揮著關鍵作用,隨著系統性能和功耗的提升,對這些無源器件的效能和數量提出了更高、更多的要求。

效能優異的無源器件可以提供更加穩定的電壓和電流,以確保AI伺服器等HPC系統正常執行,保證快速的瞬態響應和較低的紋波。低損耗的無源器件可以提高AI伺服器的能效,提升關鍵零部件的效率,節能環保。要保證AI伺服器的可靠性和穩定性,對電感提出了更高的需求。

01

AI系統的供電挑戰

與普通伺服器相比,AI伺服器所需的配置和耗能更高。由於AI伺服器的功率較普通伺服器高6~8倍,對電源的要求也同步提升,目前,市面上的通用伺服器一般需要2個800W電源,AI伺服器最多需要4個1800W電源。

隨著伺服器效能的提升,配套的電感變壓器數量必定會隨之增加。以晶片電感為例,有機構報告指出,由於GPU數量的增加,AI伺服器一共需要24~48個電感,以每個1美元計算,與普通伺服器相比,AI伺服器中的晶片電感價值量多出60%-220%。

另外,在AI伺服器中,多相或耦合電感等多合一形式逐步替代單電感應用;為了解決散熱、損耗問題,超薄應用和電源模組類供電將更加廣泛。

資料中心需要越來越多的AI加速卡,要配置大量處理器(xPU),多采用大規模平行計算方案,與普通CPU相比,xPU擁有大量小核心,有助於神經網路訓練和AI推理。然而,xPU進行AI計算、傳輸資料時會產生較大功耗。也就是說,xPU是非常耗電的晶片,其嚴格的功耗要求對AI加速卡提出了新的挑戰,這也會影響系統性能。

AI系統工作時,尤其是處理深度學習和推理等工作負載時,需要極高的計算功率。在系統層面,AI加速器對提供近乎實時的結果發揮著關鍵作用。所有xPU都有多個高階核心,這些核心由數十億個電晶體構成,消耗數百安培電流。這些xPU的核心電壓已降至1V的水平。

AI加速卡所需的峰值電流密度對任何主機板來說都是非常沉重的負擔,難以處理。工作負載的高度動態特性和極高的電流瞬變會導致非常高的di/dt和持續數微秒的尖峰電壓瞬變,這些瞬變非常具有破壞性,可能會對xPU造成損害。AI的平均工作負載會持續很長時間,解耦電容將無法始終提供滿足即時需求的能量,此時,需要消除AI加速器的瞬變,避免對整個配電網路造成損害。

目前,xPU穩壓器(VR)的要求與標準PoL穩壓器有很大不同。某些應用要求在小於1V的電壓下為xPU提供超過1000A的電流。此時,必須控制好功耗,不然,系統很難穩定工作。

如何降低AI系統能耗,成為了產業難題。目前,降低AI系統能耗的思路主要有兩種:一、降低AI系統核心處理器的能耗;二、最佳化電源管理系統,提高AI核心處理器電源管理的效率。然而,隨著AI等新興應用的普及,傳統計算系統用到的AC/DC、DC/DC、多相電源控制器和DrMOS功率級組合等方案,效率已經達到天花板,需要更先進的電源管理方案。

02

伺服器電源系統在演進

處理器的微型化導致了電源電壓降低,但消耗的電流不降反升,使得功耗持續增加。低電壓、大電流的發展趨勢帶來的問題之一是如何提升對負載波動的快速響應能力。

隨著電壓降低,電壓的容許公差變得非常小。比如,為了避免處理器的誤操作,若以±3%的精度提供磁芯電壓,則電壓為1V時的公差必須控制在±30mV。對於伺服器專用電源,即使在超過1000A的大電流負載驟變的驅動條件下,輸出電壓也必須儘可能保持穩定。

在實際應用中,低電壓、大電流發展趨勢一直在持續,通常採用高頻化和多相位化來應對。以更高的頻率進行開關操作允許採用體積更小的元件(如電容器和電感器)來管理和平滑輸入和輸出電路中的能量流動。對於基於普通矽功率半導體器件的轉換器,其典型開關頻率為30~80kHz,在這樣的頻率下,可以採用被廣泛認可的電容器,具有成本效益。然而,在這個頻率範圍之上,寄生效應就會導致過多的電阻損耗和自生熱。

雖然提高頻率對改善負載響應有很大作用,但也會極大地增加開關元件的損耗。此外,透過使用大容量外部電容器,可以在一定程度上抑制大電流應用的電壓波動,但這會增加安裝面積和電容器成本。

考慮到上述諸多情況,TLVR(Trans-Inductor Voltage Regulators)是目前應對低電壓、大電流應用中快速負載波動的主流電路配置方案。該方案是讓每個相位開關連線到一個帶額外繞組的電感器上,然後將每個相位的繞組和補償電感器串聯成迴路,以便同時為每個相位提供電流。TLVR能使處理器獲得較高的瞬態響應效能,滿足負載要求,而且電源電壓幾乎不會降低,同時降低電源損耗,可保持較小的輸出電容值,從而減少安裝面積和系統成本。

03

更多電感方案

在高效能計算系統,特別是AI伺服器的電源管理系統中,電感方案越來越多,除了上述的TLVR,還有一體成型電感、晶片電感、超薄一體成型電感等產品。

晶片電感起到為晶片前端供電的作用,主要用於電壓、電流轉換,常見於電源管理晶片(PMIC)、FPGA供電電路中。在高效能計算系統中,晶片電感、電容、MOS管與驅動晶片共同構成供電電路,滿足GPU和CPU的供電需求。

目前,主流的晶片電感採用鐵氧體材質,但鐵氧體飽和特性較差,隨著電源模組的小型化和電流的增加,鐵氧體電感體積和飽和特性已經難以滿足高效能GPU的要求,近些年,出現了一種金屬軟磁材料電感,它具有更高的效率、更小的體積,能夠更好地響應大電流變化。採用金屬軟磁材料的晶片電感,適用開關頻率可達500kHz~10MHz。

還有一種晶片電感,它基於半導體薄膜工藝,採用光刻加工工藝,不同於傳統的繞線電感和一體成型電感工藝,半導體薄膜工藝的最大特色是可以實現晶片電感產品整版生產,提高了生產效率。傳統電源模組基於SIP工藝,將晶片與電感合封在一個封裝基座上,將功率電感與封裝基座一體加工,實現功率電感與封裝基座的二合一。相比傳統的SIP需要“晶片+電感+基座”,基於半導體薄膜工藝的方案只需將晶片與整合電感及其它器件合封,即可實現完整的電源模組和周邊電路功能,進一步減小了電源模組的體積,同時提升了功率密度,降低了成本。

這種晶片電感採用了新的磁性材料,磁導率和飽和電流都很好,在6MHz頻率下,電感的材料損耗佔電感總損耗比例很低。

04

電容也很重要

在高效能計算的電源管理系統中,除了電感,電容和熱敏電阻的更新換代也在進行中。

目前,AI伺服器在整體高效能計算市場的佔比仍較低,因此,還沒有市調機構統計AI伺服器對MLCC(片式多層陶瓷電容器)的消耗量,但是,就發展形勢來看,無源器件分銷商普遍看好電容,特別是MLCC在AI伺服器中的應用前景,2024下半年將出現明顯增長態勢,MLCC規格、單價都將大幅提升。

在技術層面,計算系統處理器都需要電容配合工作,傳統上,這些電容都採用鉭或聚合物電容器。以減少對去耦電容的依賴,可以將一小部分II類 MLCC(例如X5R、X6S或X7R器件)直接放置在處理器附近。目前,有些廠商正在努力將鋁聚合物去耦電容器嵌入到封裝內的晶片載體中,與片上矽電容器一起工作,這樣可以克服高效能處理器所面臨的去耦挑戰,並支援更高的轉換器頻率,未來可能高達10MHz。

05

無源器件廠商的機遇

前些天,在英偉達舉辦的GTC大會上,伺服器代工大廠臺達電表示,在AI伺服器電源轉換系統中,如何在電流快速飆升下,讓電壓保持在GPU工作的0.8V,電感扮演著關鍵角色,它要能在高電流、低電壓狀態下保持穩定工作才行。

搭載英偉達新款Blackwell架構加速晶片的AI伺服器功耗高達1000W~1200W,電感用量較一般伺服器增加2~3倍,同時,由於功耗明顯增加,需要的電感規格更高,使得平均單價(ASP)與一般伺服器相比,高出5~8倍。.另外,由於DDR5滲透率逐步提升,必須搭配更多、更好的電感。

AI伺服器的功耗顯著提升,為了改善瞬時響應效能,需要新增TLVR電感,每臺AI伺服器需新增5~10個,而TLVR電感的單價是一般電感的3~5倍。

不止最新的AI伺服器,越來越多的高效能計算系統都需要更多、更好的電感。一般伺服器僅升級CPU,電感用量就會顯著增加,以Eagle Stream升級到Birch Stream為例,因為CPU功耗提升約50%,電感用量要增加50%~70%。

可見,對於各大無源器件廠商,特別是高品質電感企業來說,新商機就在眼前。目前,業界排名靠前的相關廠商包括TDK、國巨、順絡電子、臺慶科、ITG和EATON等。

如前文所述,在高效能計算的電源管理系統當中,晶片電感的用量正在增加,這不僅對國際大廠是好訊息,對中國本土相關企業來說,也將迎來提升產品品質和市佔率的機遇期。中國晶片電感業起步較晚,在發展初期,技術研發和生產管理水平都落後於國際大廠,特別是TDK、村田、奇力新和太陽誘電這幾家知名企業。最近幾年,中國本土的順絡電子一直在發力,排進了全球前五位,此外,值得關注的本土晶片電感企業還包括鉑科新材、麥捷科技、屹通新材、天通股份、東睦股份、橫店東磁等。

06

結語

在高效能計算系統,特別是AI伺服器的市場規模不斷擴大的當下,對關鍵晶片元器件的要求越來越高,不止GPU和CPU這些高效能處理器,對電源管理系統,及其相關晶片和元器件的用量和品質要求也有顯著提升。

作為電源管理系統當中不太顯眼,但又不能缺少,且用量較大的電感和電容來說,越來越高的計算系統功耗,正是它們充分發揮效能和作用的舞臺,相關新技術和新材料也有望不斷湧現出來。

對於無源器件廠商來說,具有高品質產品的國家大廠依然會獲得更好的商機,而對於中國本土相關企業來說,國內的巨大市場,給了它們足夠的施展空間,有更多機會搶奪國際大廠的市場份額。

高效能計算市場大漲,不起眼的元器件價值量提升8倍

​隨著高效能計算(HPC)系統,特別是AI伺服器的市場規模不斷擴大,其核心處理器,包括CPU、GPU、NPU、ASIC、FPGA等,以及記憶體、網路通訊等晶片元器件的效能和功耗水平都在提升。隨著效能提升,功率管理水平的提升顯得更加重要,因為HPC系統,特別是AI伺服器的耗電量越來越大,對整個系統,以及主要晶片的功率管理能力提出了更高要求。

在AI伺服器中,CPU需要供電,GPU板卡需要供電,記憶體(DDR4、DDR5、HBM)需要供電,各種介面也需要供電。此時,電源管理系統就顯得非常重要了,除了AC/DC電源、DC/DC轉換器等,電源管理系統當中用到的無源器件(以電感和電容為主)也發揮著關鍵作用,隨著系統性能和功耗的提升,對這些無源器件的效能和數量提出了更高、更多的要求。

效能優異的無源器件可以提供更加穩定的電壓和電流,以確保AI伺服器等HPC系統正常執行,保證快速的瞬態響應和較低的紋波。低損耗的無源器件可以提高AI伺服器的能效,提升關鍵零部件的效率,節能環保。要保證AI伺服器的可靠性和穩定性,對電感提出了更高的需求。

01

AI系統的供電挑戰

與普通伺服器相比,AI伺服器所需的配置和耗能更高。由於AI伺服器的功率較普通伺服器高6~8倍,對電源的要求也同步提升,目前,市面上的通用伺服器一般需要2個800W電源,AI伺服器最多需要4個1800W電源。

高效能計算市場大漲,不起眼的元器件價值量提升8倍

​隨著高效能計算(HPC)系統,特別是AI伺服器的市場規模不斷擴大,其核心處理器,包括CPU、GPU、NPU、ASIC、FPGA等,以及記憶體、網路通訊等晶片元器件的效能和功耗水平都在提升。隨著效能提升,功率管理水平的提升顯得更加重要,因為HPC系統,特別是AI伺服器的耗電量越來越大,對整個系統,以及主要晶片的功率管理能力提出了更高要求。

在AI伺服器中,CPU需要供電,GPU板卡需要供電,記憶體(DDR4、DDR5、HBM)需要供電,各種介面也需要供電。此時,電源管理系統就顯得非常重要了,除了AC/DC電源、DC/DC轉換器等,電源管理系統當中用到的無源器件(以電感和電容為主)也發揮著關鍵作用,隨著系統性能和功耗的提升,對這些無源器件的效能和數量提出了更高、更多的要求。

效能優異的無源器件可以提供更加穩定的電壓和電流,以確保AI伺服器等HPC系統正常執行,保證快速的瞬態響應和較低的紋波。低損耗的無源器件可以提高AI伺服器的能效,提升關鍵零部件的效率,節能環保。要保證AI伺服器的可靠性和穩定性,對電感提出了更高的需求。

01

AI系統的供電挑戰

與普通伺服器相比,AI伺服器所需的配置和耗能更高。由於AI伺服器的功率較普通伺服器高6~8倍,對電源的要求也同步提升,目前,市面上的通用伺服器一般需要2個800W電源,AI伺服器最多需要4個1800W電源。

高效能計算市場大漲,不起眼的元器件價值量提升8倍

​隨著高效能計算(HPC)系統,特別是AI伺服器的市場規模不斷擴大,其核心處理器,包括CPU、GPU、NPU、ASIC、FPGA等,以及記憶體、網路通訊等晶片元器件的效能和功耗水平都在提升。隨著效能提升,功率管理水平的提升顯得更加重要,因為HPC系統,特別是AI伺服器的耗電量越來越大,對整個系統,以及主要晶片的功率管理能力提出了更高要求。

在AI伺服器中,CPU需要供電,GPU板卡需要供電,記憶體(DDR4、DDR5、HBM)需要供電,各種介面也需要供電。此時,電源管理系統就顯得非常重要了,除了AC/DC電源、DC/DC轉換器等,電源管理系統當中用到的無源器件(以電感和電容為主)也發揮著關鍵作用,隨著系統性能和功耗的提升,對這些無源器件的效能和數量提出了更高、更多的要求。

效能優異的無源器件可以提供更加穩定的電壓和電流,以確保AI伺服器等HPC系統正常執行,保證快速的瞬態響應和較低的紋波。低損耗的無源器件可以提高AI伺服器的能效,提升關鍵零部件的效率,節能環保。要保證AI伺服器的可靠性和穩定性,對電感提出了更高的需求。

01

AI系統的供電挑戰

與普通伺服器相比,AI伺服器所需的配置和耗能更高。由於AI伺服器的功率較普通伺服器高6~8倍,對電源的要求也同步提升,目前,市面上的通用伺服器一般需要2個800W電源,AI伺服器最多需要4個1800W電源。

上一篇:​成為第二還... 下一篇:等待爆單,小...
猜你喜歡
熱門閱讀
同類推薦