熱門:
巨頭打響“推理芯片戰(zhàn)爭”
大語言模型已從研發(fā)走向應(yīng)用,AI產(chǎn)業(yè)的重心也已經(jīng)從訓(xùn)練階段轉(zhuǎn)向推理環(huán)節(jié)。今年以來,隨著華為、英偉達(dá)和谷歌三大巨頭相繼發(fā)布各自的推理芯片,一場關(guān)于AI推理芯片的戰(zhàn)爭悄然打響。
根據(jù)麥肯錫報(bào)告,全球AI推理市場規(guī)模預(yù)計(jì)在2028年將達(dá)1500億美元,年復(fù)合增長率超40%,遠(yuǎn)高于訓(xùn)練市場的20%。
南開大學(xué)金融發(fā)展研究院院長田利輝在接受《中國經(jīng)營報(bào)》記者采訪時(shí)指出,推理芯片將重塑人類生活,形成云端、邊緣、終端三元共存格局,自動駕駛、智能攝像頭、語音識別等應(yīng)用將普及,真正實(shí)現(xiàn)“AI賦能千行百業(yè)”。
三大巨頭各顯“神通”
在今年9月的2025年華為全聯(lián)接大會上,華為宣布了昇騰芯片的規(guī)劃和進(jìn)展。未來3年,華為開發(fā)和規(guī)劃了三個(gè)系列,分別是Ascend950系列、Ascend960系列、Ascend970系列。據(jù)悉,華為AI芯片將以幾乎一年一代、算力翻倍的速度,圍繞更易用、更多數(shù)據(jù)格式、更高帶寬等方向持續(xù)演進(jìn)。
同樣是在今年9月,英偉達(dá)推出專為大規(guī)模上下文處理設(shè)計(jì)的GPU——RubinCPX,預(yù)計(jì)于2026年年底上市。
今年4月,谷歌在Google Cloud Next 25大會上推出了其首款Google TPU推理芯片Ironwood。據(jù)了解,Ironwood根據(jù)AI工作負(fù)載需求提供兩種尺寸:256芯片配置和9216芯片配置。后者總算力達(dá)到42.5Exaflops(百億億次),是ElCapitan超算的24倍,單芯片峰值4.614Exaflops。
記者在采訪中獲悉,上述三家公司的推理芯片在技術(shù)路徑與市場定位上呈現(xiàn)顯著差異,在成本、效能以及應(yīng)用場景中各有千秋。英偉達(dá)憑借CUDA生態(tài)與全場景適配能力穩(wěn)居行業(yè)龍頭,谷歌TPU以ASIC架構(gòu)實(shí)現(xiàn)云端推理極致能效,華為通過集群技術(shù)與存儲優(yōu)化突破制程限制。
在成本控制上,各家公司“各顯神通”。星圖金融研究院研究員張思遠(yuǎn)向記者指出,英偉達(dá)通過存儲技術(shù)創(chuàng)新降低單位成本,華為依賴系統(tǒng)級優(yōu)化分?jǐn)偝杀?;效能表現(xiàn)上,谷歌在專用場景領(lǐng)先,英偉達(dá)全場景性能均衡。
張思遠(yuǎn)向記者表示,華為通過UCM推理記憶數(shù)據(jù)管理器構(gòu)建三級存儲架構(gòu),避免重復(fù)計(jì)算,降低推理成本。但受限于制程工藝,單芯片硬件成本較英偉達(dá)產(chǎn)品更高,需通過規(guī)模化部署攤薄成本。谷歌聚焦于ASIC架構(gòu)與云端規(guī)模化降本。
“英偉達(dá)的推理芯片以強(qiáng)大的計(jì)算能力和成熟的CUDA生態(tài)系統(tǒng)著稱,廣泛應(yīng)用于各種AI場景中。但其產(chǎn)品價(jià)格較高,增加了使用成本?!苯?jīng)濟(jì)學(xué)家、新金融專家余豐慧向記者指出。
在效能表現(xiàn)方面,張思遠(yuǎn)指出,英偉達(dá)全場景性能均衡,長上下文推理領(lǐng)先。華為的效能優(yōu)勢則體現(xiàn)在集群算力突破和行業(yè)場景深度優(yōu)化。谷歌則通過HBM(高寬帶內(nèi)存)容量與互聯(lián)帶寬驅(qū)動云端效能。
在應(yīng)用場景方面,張思遠(yuǎn)表示,英偉達(dá)實(shí)現(xiàn)全場景覆蓋,消費(fèi)級與企業(yè)級并重。華為則聚焦國內(nèi)行業(yè),在國內(nèi)政務(wù)、金融、醫(yī)療場景市場占有率較大,依托昇騰生態(tài),參與多地智算中心建設(shè),但海外市場拓展受限,消費(fèi)級場景滲透率不足。
對谷歌而言,張思遠(yuǎn)指出,谷歌以云端服務(wù)為主導(dǎo),搜索與AI模型協(xié)同。其中搜索業(yè)務(wù)依賴TPU推理加速,Cloud業(yè)務(wù)提供Gemini推理服務(wù),支持企業(yè)級MoE模型部署。但硬件僅通過云端開放,企業(yè)本地化部署需求難以滿足。
“谷歌的TPU以其高度定制化的硬件設(shè)計(jì)和出色的機(jī)器學(xué)習(xí)性能占據(jù)一席之地,不過,谷歌TPU的應(yīng)用范圍較窄,主要針對自家服務(wù)和特定合作伙伴?!庇嘭S慧補(bǔ)充道。
談及華為推理芯片的發(fā)展?fàn)顟B(tài),田利輝指出,華為實(shí)質(zhì)上形成了“算力積木”架構(gòu),進(jìn)而實(shí)現(xiàn)靈活擴(kuò)展,成本效率平衡。
行業(yè)規(guī)模將突破3000億元
推理芯片的發(fā)展將極大地促進(jìn)人工智能技術(shù)在日常生活中的普及與深化。張思遠(yuǎn)指出,首先,推理芯片的發(fā)展可能帶來效率革命,重構(gòu)服務(wù)響應(yīng)范式。推理芯片的能效提升將推動AI應(yīng)用從“實(shí)驗(yàn)室”走向“日常生活”。例如,金融客服系統(tǒng)通過華為UCM技術(shù)實(shí)現(xiàn)通話分析時(shí)間從120秒縮短至10秒;醫(yī)療領(lǐng)域,推理加速方案使醫(yī)學(xué)影像分析效率提升6倍,基層醫(yī)院也能快速獲取診斷支持。
其次,推理芯片可能帶來成本普降,降低AI應(yīng)用門檻。例如,搭載國產(chǎn)推理芯片的AI學(xué)習(xí)機(jī)大量出貨,使優(yōu)質(zhì)教育資源向三、四線城市滲透。
“最后,可能帶來產(chǎn)業(yè)升級,”張思遠(yuǎn)表示,推理芯片與邊緣設(shè)備結(jié)合,推動消費(fèi)電子形態(tài)革新。如AI眼鏡通過低功耗推理芯片實(shí)現(xiàn)實(shí)時(shí)翻譯、視覺識別,人形機(jī)器人依賴高能效推理芯片完成環(huán)境感知與運(yùn)動控制。
全球范圍內(nèi),推理芯片正處于快速發(fā)展階段,各大科技公司紛紛加大研發(fā)投入,試圖在這一新興市場分得一杯羹。
中國推理芯片市場前景廣闊,發(fā)展?jié)摿薮蟆V猩坍a(chǎn)業(yè)研究院發(fā)布的《2025—2030年人工智能芯片行業(yè)市場調(diào)研及投資前景預(yù)測報(bào)告》顯示,中國AI推理芯片相關(guān)產(chǎn)品及服務(wù)行業(yè)市場規(guī)模由2020年的113億元增至2024年的1626億元,期內(nèi)復(fù)合年增長率為94.9%。中商產(chǎn)業(yè)研究院分析師預(yù)測,2025年中國AI推理芯片相關(guān)產(chǎn)品及服務(wù)行業(yè)市場規(guī)模將達(dá)到3106億元。
以華為為例,華為輪值董事長徐直軍曾在全聯(lián)接大會上公開表示:“有了昇騰芯片為基礎(chǔ),我們就能夠打造滿足客戶需求的算力解決方案。從大型AI算力基礎(chǔ)設(shè)施建設(shè)的技術(shù)方向看,超節(jié)點(diǎn)已經(jīng)成為主導(dǎo)性產(chǎn)品形態(tài),并正在成為AI基礎(chǔ)設(shè)施建設(shè)的新常態(tài)。”“但僅有強(qiáng)大的單芯片遠(yuǎn)遠(yuǎn)不夠,如何將成千上萬張芯片高效地連接起來,形成一個(gè)協(xié)同工作的‘超級大腦’才是挑戰(zhàn)?!敝Z安基金科技組基金經(jīng)理劉慧影表示,為此,華為重磅預(yù)告了三款超節(jié)點(diǎn)產(chǎn)品,并面向超節(jié)點(diǎn)創(chuàng)新性地推出了“靈衢”全光互聯(lián)協(xié)議,且宣傳將其技術(shù)規(guī)范開源。這一舉措被認(rèn)為是算力互聯(lián)領(lǐng)域的顛覆性的突破。據(jù)悉,“靈衢”采用光傳輸技術(shù),可實(shí)現(xiàn)數(shù)據(jù)高速流轉(zhuǎn)。更重要的是,基于超節(jié)點(diǎn)與該協(xié)議打造的Atlas950超節(jié)點(diǎn),其算力水平在未來數(shù)年內(nèi)有望保持全球領(lǐng)先地位。
先進(jìn)制程有待突破
受訪人士向記者表示,隨著國家政策的支持以及市場需求的增長,本地企業(yè)也在積極布局該領(lǐng)域,如華為、寒武紀(jì)等企業(yè)已推出多款自研推理芯片,并在國內(nèi)外市場上獲得了一定的認(rèn)可。然而,整體技術(shù)水平與國際領(lǐng)先企業(yè)相比仍存在一定差距。
張思遠(yuǎn)指出,第一,在技術(shù)指標(biāo)方面,制程與單芯性能仍有巨大進(jìn)步空間。英偉達(dá)RubinCPX采用3nm制程,華為昇騰910B仍依賴7nm工藝,單芯片算力差距約3倍。第二,在生態(tài)建設(shè)方面,開發(fā)者生態(tài)壁壘顯著。英偉達(dá)CUDA生態(tài)積累超15年,全球超400萬開發(fā)者支持;華為CANN架構(gòu)開發(fā)者數(shù)量突破50萬,但工具鏈完善度仍需提升,部分企業(yè)因遷移成本高而選擇繼續(xù)使用英偉達(dá)方案。第三,在市場滲透方面,中國企業(yè)國際份額與場景覆蓋不足,相比之下,英偉達(dá)推理芯片全球市場占比超70%,覆蓋云廠商、消費(fèi)電子等多領(lǐng)域。
“中國芯片主要集中在國內(nèi)政務(wù)、安防等toG場景,海外市場拓展緩慢,且高端消費(fèi)級市場仍以進(jìn)口為主?!睆埶歼h(yuǎn)說。
北京社科院副研究員王鵬表示,國產(chǎn)推理芯片在政企、安防領(lǐng)域的滲透率較高,但高端訓(xùn)練芯片與復(fù)雜模型支持能力不足。
“中國芯片企業(yè)正通過‘應(yīng)用場景驅(qū)動—數(shù)據(jù)積累—算法優(yōu)化—芯片迭代’閉環(huán)加速追趕,本土品牌滲透率從30%持續(xù)提升,2025年市場規(guī)模將突破1530億元。”田利輝說,一些國內(nèi)企業(yè)正在探索存算一體和3Dmemory技術(shù),未來將突破大規(guī)模集群互聯(lián)瓶頸,實(shí)現(xiàn)從“跟跑”到“并跑”的跨越,真正成為全球AI基礎(chǔ)設(shè)施的核心力量。
薩摩耶云科技集團(tuán)首席經(jīng)濟(jì)學(xué)家鄭磊向記者表示,中國推理芯片正在從“可用”向“好用”階段過渡,但在先進(jìn)工藝、存儲帶寬、軟件棧與極致性能場景上仍落后全球頂尖水平,下一步,行業(yè)需在RISC-V開源指令集、Chiplet國產(chǎn)封裝線、AI編譯器框架及行業(yè)芯片協(xié)同定義上加速迭代,方能真正與世界頭部公司在同一梯隊(duì)競爭。
(文章來源:中國經(jīng)營網(wǎng))
(原標(biāo)題:巨頭打響“推理芯片戰(zhàn)爭”)
(責(zé)任編輯:137)
將天天基金網(wǎng)設(shè)為上網(wǎng)首頁嗎? 將天天基金網(wǎng)添加到收藏夾嗎?
關(guān)于我們|資質(zhì)證明|研究中心|聯(lián)系我們|安全指引|免責(zé)條款|隱私條款|風(fēng)險(xiǎn)提示函|意見建議|在線客服|誠聘英才
天天基金客服熱線:95021 |客服郵箱:vip@1234567.com.cn|人工服務(wù)時(shí)間:工作日 7:30-21:30 雙休日 9:00-21:30
鄭重聲明:天天基金系證監(jiān)會批準(zhǔn)的基金銷售機(jī)構(gòu)[000000303]。天天基金網(wǎng)所載文章、數(shù)據(jù)僅供參考,使用前請核實(shí),風(fēng)險(xiǎn)自負(fù)。
中國證監(jiān)會上海監(jiān)管局網(wǎng)址:www.csrc.gov.cn/pub/shanghai
CopyRight 上海天天基金銷售有限公司 2011-現(xiàn)在 滬ICP證:滬B2-20130026 網(wǎng)站備案號:滬ICP備11042629號-1
- D
- 德邦基金德邦證券資管大成基金東財(cái)基金達(dá)誠基金東方阿爾法基金東方紅資產(chǎn)管理東方基金東莞證券東?;?/a>東海證券東吳基金東吳證券東興基金東興證券第一創(chuàng)業(yè)東證融匯證券資產(chǎn)管理
- G
- 光大保德信基金國都證券廣發(fā)基金廣發(fā)資產(chǎn)管理國海富蘭克林基金國海證券國金基金國聯(lián)安基金國聯(lián)基金格林基金國聯(lián)民生國聯(lián)證券資產(chǎn)管理國融基金國壽安?;?/a>國泰海通資管國泰基金國投瑞銀基金國投證券國投證券資產(chǎn)管理國新國證基金國信證券國新證券股份國信證券資產(chǎn)管理工銀瑞信基金國元證券