無線電信解決方案供應(yīng)商高通(QCOM.US),已經(jīng)不滿足於在智能電話芯片市場(chǎng)的領(lǐng)先地位,發(fā)佈AI200和AI250芯片加速器及機(jī)架解決方案,進(jìn)入當(dāng)前由英偉達(dá)(NVDA.US)主導(dǎo)的AI推理解決方案市場(chǎng)。
高通表示,這兩款A(yù)I芯片的賣點(diǎn)在於性價(jià)比,以最優(yōu)惠的總體擁有成本(TCO),為數(shù)據(jù)中心生成式AI推理提供機(jī)架級(jí)性能、超大內(nèi)存容量和卓越能效。這兩款解決方案將配備完善的軟件堆棧,與主流AI框架無縫兼容,可幫助企業(yè)和開發(fā)者跨數(shù)據(jù)中心部署可擴(kuò)展的生成式AI。
AI200推出專為機(jī)架級(jí)AI推理打造的解決方案,為大規(guī)模語言與多模態(tài)模型推理及其他AI工作負(fù)載實(shí)現(xiàn)更低總體擁有成本(TCO)與優(yōu)化性能。單卡支持768GB LPDDR內(nèi)存,以更高內(nèi)存容量和更低成本為AI推理提供擴(kuò)展性與靈活性。
AI250解決方案首創(chuàng)基於近存計(jì)算的創(chuàng)新內(nèi)存架構(gòu),通過提升逾10倍的有效內(nèi)存帶寬並大幅降低功耗,為AI推理工作負(fù)載帶來能效與性能的代際飛躍。這實(shí)現(xiàn)了分解式AI推理,在滿足客戶性能與成本需求的同時(shí)提升硬件利用率。
兩款機(jī)架解決方案均配備直接液冷散熱繫統(tǒng)以提升能效,支持PCIe縱向擴(kuò)展與以太網(wǎng)橫向擴(kuò)展,採用機(jī)密計(jì)算技術(shù)保障AI工作負(fù)載安全,整機(jī)架功耗達(dá)160千瓦,高通還承諾每年更新其AI數(shù)據(jù)中心硬件產(chǎn)品。
AI200與AI250預(yù)計(jì)將分別於2026年及2027年投入商用。
高通的野心
實(shí)際上,高通因面向移動(dòng)領(lǐng)域的驍龍?zhí)幚砥鳎⊿napdragon)和無線連接芯片聞名,但顯然數(shù)萬億美元的AI芯片市場(chǎng)更為吸引。據(jù)CNBC報(bào)道,到2030年,用於建設(shè)數(shù)據(jù)中心的資本開支將達(dá)到6.7萬億美元,其中大部分將用於購買AI芯片,而目前AI芯片市場(chǎng)由英偉達(dá)佔(zhàn)據(jù)大部分市場(chǎng),其次為AMD,高通的參與將對(duì)英偉達(dá)及AMD(AMD.US)構(gòu)成競(jìng)爭(zhēng)。
高通的全新AI加速器繫列汲取了其智能電話芯片Hexagon神經(jīng)處理器(NPU)的技術(shù)精髓——通過該技術(shù)優(yōu)化智能手機(jī)低功耗機(jī)器學(xué)習(xí)任務(wù)效率。
高通的高管表示,同樣的架構(gòu)效率將使高通的機(jī)架級(jí)繫統(tǒng)在成本上具備與英偉達(dá)和AMD數(shù)據(jù)中心解決方案的競(jìng)爭(zhēng)力。
高通數(shù)據(jù)中心與邊緣業(yè)務(wù)總經(jīng)理杜爾加·馬拉迪在財(cái)報(bào)電話會(huì)議中表示:「我們的發(fā)展路徑是先通過移動(dòng)端與邊緣計(jì)算領(lǐng)域證明實(shí)力,再拓展至數(shù)據(jù)中心層級(jí)。我們的架構(gòu)支持客戶直接採購?fù)暾麢C(jī)架繫統(tǒng),也可將芯片與自主設(shè)計(jì)硬件相結(jié)合。」
據(jù)悉,高通新一代繫統(tǒng)的硬件架構(gòu)與英偉達(dá)HGX及AMD Instinct平臺(tái)類似,在大型機(jī)架中容納數(shù)十個(gè)相互連接的加速器,作為統(tǒng)一計(jì)算單元運(yùn)行,AI實(shí)驗(yàn)室需要這種規(guī)模的算力來運(yùn)行最先進(jìn)的模型。
與英偉達(dá)專精訓(xùn)練和推理的H100 GPU不同,高通僅專注於推理工作負(fù)載領(lǐng)域,包括利用預(yù)訓(xùn)練模型生成文本,或支持需要實(shí)時(shí)處理的交互式應(yīng)用,高通管理層透露,這些任務(wù)在數(shù)據(jù)中心AI應(yīng)用中的佔(zhàn)比正持續(xù)提升。
高通沒有公佈定價(jià)方案及單機(jī)架會(huì)搭載多少NPU,但其確認(rèn)可支持768GB內(nèi)存,容量超越英偉達(dá)和AMD的同類產(chǎn)品,並表示已開發(fā)新型內(nèi)存管理架構(gòu),以提升推理速度同時(shí)降低能耗。此外,其繫統(tǒng)也能以獨(dú)立組建形式供應(yīng)給偏好自主設(shè)計(jì)組裝機(jī)架的超大規(guī)模雲(yún)運(yùn)營(yíng)商,甚至能為競(jìng)爭(zhēng)對(duì)手例如英偉達(dá)和AMD等,供應(yīng)CPU和加速卡。
同日,高通宣佈與隸屬於沙特公共投資基金(PIF)的AI企業(yè)HUMAIN達(dá)成合作:HUMAIN自2026年起部署總?cè)萘窟_(dá)200兆瓦的高通AI200和AI250機(jī)架解決方案,為沙特阿拉伯及全球提供高性能AI推理服務(wù)。
受此推動(dòng),高通的股價(jià)大漲11.09%,市值達(dá)2,025億美元。
英偉達(dá)腹背受敵?
自從OpenAI掀起的生成式AI卷動(dòng)全球人工智能發(fā)展浪潮以來,英偉達(dá)可謂左右逢源,憑借其先進(jìn)的AI芯片,成為各大科技巨頭的重要採購源頭。
但是,高昂的價(jià)格、供不應(yīng)求的現(xiàn)狀,也讓其客戶坐不住了,OpenAI近日宣佈從AMD購買芯片,並可能獲得AMD的注資,且早前已表示計(jì)劃與博通(AVGO.US)聯(lián)手開發(fā)自研芯片。
此外,谷歌(GOOG.US)、亞馬遜(AMZN.US)、微軟(MSFT.US)等有錢、有團(tuán)隊(duì)的大客戶,也在開發(fā)自己的AI加速器,以滿足其需求。
馬斯克也在上週特斯拉(TSLA.US)的季績(jī)發(fā)佈會(huì)上表示,由臺(tái)積電(TSM.US)與三星共同生產(chǎn)特斯拉自研的AI五代芯片,以實(shí)現(xiàn)超額供應(yīng),在車載與機(jī)器人領(lǐng)域無法完全消化產(chǎn)能時(shí),剩餘芯片可隨時(shí)部署於數(shù)據(jù)中心。同時(shí)他表示,此舉並非要取代英偉達(dá),而是要通過自研和自行更新與優(yōu)化,貼合企業(yè)自身需要,這或進(jìn)一步分流英偉達(dá)的需求。
即便如此,投資者似乎並未對(duì)英偉達(dá)失去信心,英偉達(dá)同日股價(jià)上漲2.81%,市值達(dá)到4.65萬億美元;AMD的股價(jià)也大漲2.67%,市值為4,214億美元。
結(jié)語
高通憑借AI200和AI250繫列,正式從移動(dòng)端向數(shù)據(jù)中心AI推理市場(chǎng)邁出了關(guān)鍵一步。其戰(zhàn)略核心非常清晰:不直接挑戰(zhàn)英偉達(dá)在AI訓(xùn)練和全棧生態(tài)上的絕對(duì)統(tǒng)治力,而是聚焦於推理工作負(fù)載,以自身擅長(zhǎng)的低功耗技術(shù)和突出的「性價(jià)比」(TCO)作為差異化競(jìng)爭(zhēng)優(yōu)勢(shì)。
高通的入場(chǎng),為市場(chǎng)帶來了一個(gè)值得關(guān)注的新選擇。其創(chuàng)新的內(nèi)存架構(gòu)、靈活的供應(yīng)模式(提供整機(jī)架或獨(dú)立組件)以及與HUMAIN的重大合作,都證明了其具備在特定細(xì)分市場(chǎng)立足的潛力。這反映了AI芯片市場(chǎng)正在走向多元化和專業(yè)化,客戶開始根據(jù)具體工作負(fù)載(訓(xùn)練vs.推理)、成本效益和功耗來尋求更優(yōu)解。
然而,必須清醒地認(rèn)識(shí)到,英偉達(dá)憑借其CUDA軟件生態(tài)和硬件性能構(gòu)築的護(hù)城河依然極深。短期來看,高通的加入難以撼動(dòng)英偉達(dá)的領(lǐng)導(dǎo)地位,但它和AMD、眾多自研芯片的雲(yún)廠商一起,正共同推動(dòng)AI算力市場(chǎng)從一個(gè)供應(yīng)商主導(dǎo)的局面,逐步走向一個(gè)更多元、競(jìng)爭(zhēng)更激烈的未來。對(duì)於企業(yè)和開發(fā)者而言,這種競(jìng)爭(zhēng)無疑將帶來更多選擇和更優(yōu)化的成本結(jié)構(gòu)。
更多精彩內(nèi)容,請(qǐng)登陸
財(cái)華香港網(wǎng) (http://www.szkeh.com/)
現(xiàn)代電視 (http://www.fintv.com)