英特爾雖然策略相對保守,但是卻正在通過價(jià)格來取勝,英特爾推出了Gaudi人工智能加速器的積極定價(jià)策略。英特爾表示,一套包含八個(gè)英特爾Gaudi 2加速器和一個(gè)通用基板的標(biāo)準(zhǔn)數(shù)據(jù)中心AI套件將以65,000美元的價(jià)格提供給系統(tǒng)提供商,這大約是同類競爭平臺(tái)價(jià)格的三分之一。英特爾表示,一套包含八個(gè)英特爾Gaudi 3加速器的套件將以125,000美元的價(jià)格出售,這大約是同類競爭平臺(tái)價(jià)格的三分之二。AMD和Nvidia雖然不公開討論其芯片的定價(jià),但根據(jù)定制服務(wù)器供應(yīng)商Thinkmate的說法,配備八個(gè)Nvidia H100 AI芯片的同類HGX服務(wù)器系統(tǒng)的成本可能超過30萬美元。
一路高歌猛進(jìn)的芯片巨頭們,新產(chǎn)品發(fā)布速度和定價(jià)凸顯了AI芯片市場的競爭激烈程度,也讓眾多AI初創(chuàng)芯片玩家望其項(xiàng)背??梢灶A(yù)見,三大芯片巨頭將分食大部分的AI市場,大量的AI初創(chuàng)公司分得一點(diǎn)點(diǎn)羹湯。
工藝奔向3納米
AI芯片走向3納米是大勢所趨,這包括數(shù)據(jù)中心乃至邊緣AI、終端。3納米是目前最先進(jìn)工藝節(jié)點(diǎn),3納米工藝帶來的性能提升、功耗降低和晶體管密度增加是AI芯片發(fā)展的重要驅(qū)動(dòng)力。對于高能耗的數(shù)據(jù)中心來說,3納米工藝的低功耗特性至關(guān)重要,它能夠有效降低數(shù)據(jù)中心的運(yùn)營成本,緩解數(shù)據(jù)中心的能源壓力,并為綠色數(shù)據(jù)中心的建設(shè)提供重要支撐。
英偉達(dá)的B200 GPU功耗高達(dá)1000W,而由兩個(gè)B200 GPU和一個(gè)Grace CPU組成的GB200解決方案消耗高達(dá)2700W的功率。這樣的功耗使得數(shù)據(jù)中心難以為這些計(jì)算GPU的大型集群提供電力和冷卻,因此英偉達(dá)必須采取措施。
Rubin GPU的設(shè)計(jì)目標(biāo)之一是控制功耗,天風(fēng)國際證券分析師郭明錤在X上寫道,Rubin GPU很可能采用臺(tái)積電3納米工藝技術(shù)制造。另據(jù)外媒介紹,Rubin GPU將采用4x光罩設(shè)計(jì),并將使用臺(tái)積電CoWoS-L封裝技術(shù)。與基于Blackwell的產(chǎn)品相比,Rubin GPU是否真的能夠降低功耗,同時(shí)明顯提高性能,或者它是否會(huì)專注于性能效率,還有待觀察。
AMD Instinct系列此前一直采用5納米/6納米雙節(jié)點(diǎn)的Chiplet模式,而到了MI350系列,也升級(jí)為了3納米。半導(dǎo)體知名分析師陸行之表示,如果英偉達(dá)在加速需求下對臺(tái)積電下單需求量大,可能會(huì)讓AMD得不到足夠產(chǎn)能,轉(zhuǎn)而向三星下訂單。
英特爾用于生成式AI的主打芯片Gaudi 3采用的是臺(tái)積電的5納米,對于 Gaudi 3,這部分競爭正在略微縮小。不過,英特爾的重心似乎更側(cè)重于AI PC,從英特爾最新發(fā)布的PC端Lunar Lake SoC來看,也已經(jīng)使用了3納米。Lunar Lake包含代號(hào)為Lion Cove的新 Lion Cove P核設(shè)計(jì)和新一波Skymont E 核,它取代了 Meteor Lake 的 Low Power Island Cresmont E 核。英特爾已披露其采用 4P+4E(8 核)設(shè)計(jì),禁用超線程/SMT。整個(gè)計(jì)算塊,包括P核和E核,都建立在臺(tái)積電的N3B節(jié)點(diǎn)上,而SoC塊則使用臺(tái)積電N6節(jié)點(diǎn)制造。
在邊緣和終端AI芯片領(lǐng)域,IP大廠Arm也在今年5月發(fā)布了用于智能手機(jī)的第五代 Cortex-X 內(nèi)核以及帶有最新高性能圖形單元的計(jì)算子系統(tǒng) (CSS)。Arm Cortex-X925 CPU就利用了3納米工藝節(jié)點(diǎn),得益于此,該CPU單線程性能提高了36%,AI性能提升了41%,可以顯著提高如大語言模型(LLM)等設(shè)備端生成式AI的響應(yīng)能力。
高帶寬內(nèi)存(HBM)是必需品
HBM(High Bandwidth Memory,高帶寬存儲(chǔ)器)已經(jīng)成為AI芯片不可或缺的關(guān)鍵組件。HBM技術(shù)經(jīng)歷了幾代發(fā)展:第一代(HBM)、第二代(HBM2)、第三代(HBM2E)、第四代(HBM3)和第五代(HBM3E),目前正在積極發(fā)展第六代HBM。HBM不斷突破性能極限,滿足AI芯片日益增長的帶寬需求。
在目前一代的AI芯片當(dāng)中,各家基本已經(jīng)都相繼采用了第五代HBM-HBM3E。例如英偉達(dá)Blackwell Ultra中的HBM3E增加到了12顆,AMD MI325X擁有288GB的HBM3e內(nèi)存,比MI300X多96GB。英特爾的 Gaudi 3封裝了八塊HBM芯片,Gaudi 3能夠如此拼性價(jià)比,可能很重要的一點(diǎn)也是它使用了較便宜的HBM2e。