Marvell Technology, Inc. 近日宣布其在共封裝光學(xué)(Co-Packaged Optics,CPO)技術(shù)上的重要進(jìn)展,用于定制AI加速器(XPU)?;谧罱l(fā)布的高帶寬內(nèi)存(HBM)計(jì)算架構(gòu),Marvell正在擴(kuò)展其定制硅片領(lǐng)導(dǎo)地位,通過讓客戶將CPO無(wú)縫集成到下一代定制XPU中,實(shí)現(xiàn)從當(dāng)前單個(gè)機(jī)架內(nèi)數(shù)十個(gè)XPU使用銅纜連接,到跨多個(gè)機(jī)架數(shù)百個(gè)XPU使用CPO連接的轉(zhuǎn)變,從而顯著提升AI服務(wù)器性能。
??Marvell的創(chuàng)新架構(gòu)使云超大規(guī)模供應(yīng)商能夠開發(fā)出更高帶寬密度的定制XPU,并在單一AI服務(wù)器內(nèi)實(shí)現(xiàn)更遠(yuǎn)距離的XPU間連接,同時(shí)保持最優(yōu)的延遲和功耗效率。此架構(gòu)現(xiàn)已可用于Marvell客戶的下一代定制XPU設(shè)計(jì)中。
??Marvell的定制AI加速器架構(gòu)將XPU計(jì)算芯片、HBM和其他Chiplets與Marvell 3D SiPho引擎結(jié)合在同一襯底上,采用高速SerDes、模對(duì)模接口和先進(jìn)封裝技術(shù)。這一做法消除了電信號(hào)需要離開XPU封裝進(jìn)入銅纜或穿過印刷電路板的需求。通過集成光學(xué)組件,XPU之間的連接可以實(shí)現(xiàn)比傳統(tǒng)電氣線纜快百倍的數(shù)據(jù)傳輸速率和距離,使得AI服務(wù)器內(nèi)的擴(kuò)展連接能夠跨越多個(gè)機(jī)架,同時(shí)保持最佳的延遲和功耗。
??CPO技術(shù)將光學(xué)組件直接集成在一個(gè)封裝內(nèi),最小化電路徑長(zhǎng)度。這種緊密耦合大大減少了信號(hào)損失,增強(qiáng)了高速信號(hào)完整性,并降低了延遲。CPO通過利用高帶寬硅光子學(xué)光學(xué)引擎來(lái)提高數(shù)據(jù)吞吐量,相比傳統(tǒng)銅連接,這些引擎提供更高的數(shù)據(jù)傳輸速率且不易受電磁干擾影響。此外,它還通過減少對(duì)高功率電驅(qū)動(dòng)器、重定時(shí)器的需求來(lái)改善功耗效率。CPO技術(shù)通過啟用更長(zhǎng)距離和更高密度的XPU至XPU連接,促進(jìn)了高性能、大容量的可擴(kuò)展AI服務(wù)器的發(fā)展,優(yōu)化了下一代加速基礎(chǔ)設(shè)施的計(jì)算性能和功耗。
??在OFC 2024上首次亮相的Marvell 3D SiPho引擎,是業(yè)內(nèi)首款支持200Gbps電接口和光接口的技術(shù),為將共封裝光學(xué)(CPO)集成到XPU中提供了基礎(chǔ)構(gòu)建模塊。Marvell的6.4T 3D SiPho引擎是一個(gè)高度集成的光引擎,它集成了32個(gè)通道的200Gbps電接口和光接口,以及包括調(diào)制器、光電探測(cè)器、調(diào)制器驅(qū)動(dòng)器、跨阻抗放大器、微控制器在內(nèi)的數(shù)百個(gè)組件,以及其他眾多無(wú)源組件,所有這些都被整合到一個(gè)統(tǒng)一的設(shè)備中,從而實(shí)現(xiàn)了相比100Gbps接口的同類設(shè)備兩倍的帶寬、兩倍的輸入/輸出帶寬密度,并且每比特功耗降低了30%。目前,多家客戶正在評(píng)估這項(xiàng)技術(shù),考慮將其集成到下一代解決方案中。