首頁 > 正文

巨頭打響“推理芯片戰(zhàn)爭”

2025年10月11日 04:07
作者:顧夢軒 李正豪
來源: 中國經(jīng)營網(wǎng)
編輯:東方財(cái)富網(wǎng)

  大語言模型已從研發(fā)走向應(yīng)用,AI產(chǎn)業(yè)的重心也已經(jīng)從訓(xùn)練階段轉(zhuǎn)向推理環(huán)節(jié)。今年以來,隨著華為、英偉達(dá)和谷歌三大巨頭相繼發(fā)布各自的推理芯片,一場關(guān)于AI推理芯片的戰(zhàn)爭悄然打響。

  根據(jù)麥肯錫報(bào)告,全球AI推理市場規(guī)模預(yù)計(jì)在2028年將達(dá)1500億美元,年復(fù)合增長率超40%,遠(yuǎn)高于訓(xùn)練市場的20%。

  南開大學(xué)金融發(fā)展研究院院長田利輝在接受《中國經(jīng)營報(bào)》記者采訪時(shí)指出,推理芯片將重塑人類生活,形成云端、邊緣、終端三元共存格局,自動駕駛、智能攝像頭、語音識別等應(yīng)用將普及,真正實(shí)現(xiàn)“AI賦能千行百業(yè)”。

  三大巨頭各顯“神通”

  在今年9月的2025年華為全聯(lián)接大會上,華為宣布了昇騰芯片的規(guī)劃和進(jìn)展。未來3年,華為開發(fā)和規(guī)劃了三個(gè)系列,分別是Ascend950系列、Ascend960系列、Ascend970系列。據(jù)悉,華為AI芯片將以幾乎一年一代、算力翻倍的速度,圍繞更易用、更多數(shù)據(jù)格式、更高帶寬等方向持續(xù)演進(jìn)。

  同樣是在今年9月,英偉達(dá)推出專為大規(guī)模上下文處理設(shè)計(jì)的GPU——RubinCPX,預(yù)計(jì)于2026年年底上市。

  今年4月,谷歌在Google Cloud Next 25大會上推出了其首款Google TPU推理芯片Ironwood。據(jù)了解,Ironwood根據(jù)AI工作負(fù)載需求提供兩種尺寸:256芯片配置和9216芯片配置。后者總算力達(dá)到42.5Exaflops(百億億次),是ElCapitan超算的24倍,單芯片峰值4.614Exaflops。

  記者在采訪中獲悉,上述三家公司的推理芯片在技術(shù)路徑與市場定位上呈現(xiàn)顯著差異,在成本、效能以及應(yīng)用場景中各有千秋。英偉達(dá)憑借CUDA生態(tài)與全場景適配能力穩(wěn)居行業(yè)龍頭,谷歌TPU以ASIC架構(gòu)實(shí)現(xiàn)云端推理極致能效,華為通過集群技術(shù)與存儲優(yōu)化突破制程限制。

  在成本控制上,各家公司“各顯神通”。星圖金融研究院研究員張思遠(yuǎn)向記者指出,英偉達(dá)通過存儲技術(shù)創(chuàng)新降低單位成本,華為依賴系統(tǒng)級優(yōu)化分?jǐn)偝杀?;效能表現(xiàn)上,谷歌在專用場景領(lǐng)先,英偉達(dá)全場景性能均衡。

  張思遠(yuǎn)向記者表示,華為通過UCM推理記憶數(shù)據(jù)管理器構(gòu)建三級存儲架構(gòu),避免重復(fù)計(jì)算,降低推理成本。但受限于制程工藝,單芯片硬件成本較英偉達(dá)產(chǎn)品更高,需通過規(guī)模化部署攤薄成本。谷歌聚焦于ASIC架構(gòu)與云端規(guī)模化降本。

  “英偉達(dá)的推理芯片以強(qiáng)大的計(jì)算能力和成熟的CUDA生態(tài)系統(tǒng)著稱,廣泛應(yīng)用于各種AI場景中。但其產(chǎn)品價(jià)格較高,增加了使用成本?!苯?jīng)濟(jì)學(xué)家、新金融專家余豐慧向記者指出。

  在效能表現(xiàn)方面,張思遠(yuǎn)指出,英偉達(dá)全場景性能均衡,長上下文推理領(lǐng)先。華為的效能優(yōu)勢則體現(xiàn)在集群算力突破和行業(yè)場景深度優(yōu)化。谷歌則通過HBM(高寬帶內(nèi)存)容量與互聯(lián)帶寬驅(qū)動云端效能。

  在應(yīng)用場景方面,張思遠(yuǎn)表示,英偉達(dá)實(shí)現(xiàn)全場景覆蓋,消費(fèi)級與企業(yè)級并重。華為則聚焦國內(nèi)行業(yè),在國內(nèi)政務(wù)、金融、醫(yī)療場景市場占有率較大,依托昇騰生態(tài),參與多地智算中心建設(shè),但海外市場拓展受限,消費(fèi)級場景滲透率不足。

  對谷歌而言,張思遠(yuǎn)指出,谷歌以云端服務(wù)為主導(dǎo),搜索與AI模型協(xié)同。其中搜索業(yè)務(wù)依賴TPU推理加速,Cloud業(yè)務(wù)提供Gemini推理服務(wù),支持企業(yè)級MoE模型部署。但硬件僅通過云端開放,企業(yè)本地化部署需求難以滿足。

  “谷歌的TPU以其高度定制化的硬件設(shè)計(jì)和出色的機(jī)器學(xué)習(xí)性能占據(jù)一席之地,不過,谷歌TPU的應(yīng)用范圍較窄,主要針對自家服務(wù)和特定合作伙伴?!庇嘭S慧補(bǔ)充道。

  談及華為推理芯片的發(fā)展?fàn)顟B(tài),田利輝指出,華為實(shí)質(zhì)上形成了“算力積木”架構(gòu),進(jìn)而實(shí)現(xiàn)靈活擴(kuò)展,成本效率平衡。

  行業(yè)規(guī)模將突破3000億元

  推理芯片的發(fā)展將極大地促進(jìn)人工智能技術(shù)在日常生活中的普及與深化。張思遠(yuǎn)指出,首先,推理芯片的發(fā)展可能帶來效率革命,重構(gòu)服務(wù)響應(yīng)范式。推理芯片的能效提升將推動AI應(yīng)用從“實(shí)驗(yàn)室”走向“日常生活”。例如,金融客服系統(tǒng)通過華為UCM技術(shù)實(shí)現(xiàn)通話分析時(shí)間從120秒縮短至10秒;醫(yī)療領(lǐng)域,推理加速方案使醫(yī)學(xué)影像分析效率提升6倍,基層醫(yī)院也能快速獲取診斷支持。

  其次,推理芯片可能帶來成本普降,降低AI應(yīng)用門檻。例如,搭載國產(chǎn)推理芯片的AI學(xué)習(xí)機(jī)大量出貨,使優(yōu)質(zhì)教育資源向三、四線城市滲透。

  “最后,可能帶來產(chǎn)業(yè)升級,”張思遠(yuǎn)表示,推理芯片與邊緣設(shè)備結(jié)合,推動消費(fèi)電子形態(tài)革新。如AI眼鏡通過低功耗推理芯片實(shí)現(xiàn)實(shí)時(shí)翻譯、視覺識別,人形機(jī)器人依賴高能效推理芯片完成環(huán)境感知與運(yùn)動控制。

  全球范圍內(nèi),推理芯片正處于快速發(fā)展階段,各大科技公司紛紛加大研發(fā)投入,試圖在這一新興市場分得一杯羹。

  中國推理芯片市場前景廣闊,發(fā)展?jié)摿薮蟆V猩坍a(chǎn)業(yè)研究院發(fā)布的《2025—2030年人工智能芯片行業(yè)市場調(diào)研及投資前景預(yù)測報(bào)告》顯示,中國AI推理芯片相關(guān)產(chǎn)品及服務(wù)行業(yè)市場規(guī)模由2020年的113億元增至2024年的1626億元,期內(nèi)復(fù)合年增長率為94.9%。中商產(chǎn)業(yè)研究院分析師預(yù)測,2025年中國AI推理芯片相關(guān)產(chǎn)品及服務(wù)行業(yè)市場規(guī)模將達(dá)到3106億元。

  以華為為例,華為輪值董事長徐直軍曾在全聯(lián)接大會上公開表示:“有了昇騰芯片為基礎(chǔ),我們就能夠打造滿足客戶需求的算力解決方案。從大型AI算力基礎(chǔ)設(shè)施建設(shè)的技術(shù)方向看,超節(jié)點(diǎn)已經(jīng)成為主導(dǎo)性產(chǎn)品形態(tài),并正在成為AI基礎(chǔ)設(shè)施建設(shè)的新常態(tài)。”“但僅有強(qiáng)大的單芯片遠(yuǎn)遠(yuǎn)不夠,如何將成千上萬張芯片高效地連接起來,形成一個(gè)協(xié)同工作的‘超級大腦’才是挑戰(zhàn)?!敝Z安基金科技組基金經(jīng)理劉慧影表示,為此,華為重磅預(yù)告了三款超節(jié)點(diǎn)產(chǎn)品,并面向超節(jié)點(diǎn)創(chuàng)新性地推出了“靈衢”全光互聯(lián)協(xié)議,且宣傳將其技術(shù)規(guī)范開源。這一舉措被認(rèn)為是算力互聯(lián)領(lǐng)域的顛覆性的突破。據(jù)悉,“靈衢”采用光傳輸技術(shù),可實(shí)現(xiàn)數(shù)據(jù)高速流轉(zhuǎn)。更重要的是,基于超節(jié)點(diǎn)與該協(xié)議打造的Atlas950超節(jié)點(diǎn),其算力水平在未來數(shù)年內(nèi)有望保持全球領(lǐng)先地位。

  先進(jìn)制程有待突破

  受訪人士向記者表示,隨著國家政策的支持以及市場需求的增長,本地企業(yè)也在積極布局該領(lǐng)域,如華為、寒武紀(jì)等企業(yè)已推出多款自研推理芯片,并在國內(nèi)外市場上獲得了一定的認(rèn)可。然而,整體技術(shù)水平與國際領(lǐng)先企業(yè)相比仍存在一定差距。

  張思遠(yuǎn)指出,第一,在技術(shù)指標(biāo)方面,制程與單芯性能仍有巨大進(jìn)步空間。英偉達(dá)RubinCPX采用3nm制程,華為昇騰910B仍依賴7nm工藝,單芯片算力差距約3倍。第二,在生態(tài)建設(shè)方面,開發(fā)者生態(tài)壁壘顯著。英偉達(dá)CUDA生態(tài)積累超15年,全球超400萬開發(fā)者支持;華為CANN架構(gòu)開發(fā)者數(shù)量突破50萬,但工具鏈完善度仍需提升,部分企業(yè)因遷移成本高而選擇繼續(xù)使用英偉達(dá)方案。第三,在市場滲透方面,中國企業(yè)國際份額與場景覆蓋不足,相比之下,英偉達(dá)推理芯片全球市場占比超70%,覆蓋云廠商、消費(fèi)電子等多領(lǐng)域。

  “中國芯片主要集中在國內(nèi)政務(wù)、安防等toG場景,海外市場拓展緩慢,且高端消費(fèi)級市場仍以進(jìn)口為主?!睆埶歼h(yuǎn)說。

  北京社科院副研究員王鵬表示,國產(chǎn)推理芯片在政企、安防領(lǐng)域的滲透率較高,但高端訓(xùn)練芯片與復(fù)雜模型支持能力不足。

  “中國芯片企業(yè)正通過‘應(yīng)用場景驅(qū)動—數(shù)據(jù)積累—算法優(yōu)化—芯片迭代’閉環(huán)加速追趕,本土品牌滲透率從30%持續(xù)提升,2025年市場規(guī)模將突破1530億元。”田利輝說,一些國內(nèi)企業(yè)正在探索存算一體和3Dmemory技術(shù),未來將突破大規(guī)模集群互聯(lián)瓶頸,實(shí)現(xiàn)從“跟跑”到“并跑”的跨越,真正成為全球AI基礎(chǔ)設(shè)施的核心力量。

  薩摩耶云科技集團(tuán)首席經(jīng)濟(jì)學(xué)家鄭磊向記者表示,中國推理芯片正在從“可用”向“好用”階段過渡,但在先進(jìn)工藝、存儲帶寬、軟件棧與極致性能場景上仍落后全球頂尖水平,下一步,行業(yè)需在RISC-V開源指令集、Chiplet國產(chǎn)封裝線、AI編譯器框架及行業(yè)芯片協(xié)同定義上加速迭代,方能真正與世界頭部公司在同一梯隊(duì)競爭。

(文章來源:中國經(jīng)營網(wǎng))

(原標(biāo)題:巨頭打響“推理芯片戰(zhàn)爭”)

(責(zé)任編輯:137)

 
 
 
 

網(wǎng)友點(diǎn)擊排行

 
  • 基金
  • 財(cái)經(jīng)
  • 股票
  • 基金吧
 
鄭重聲明:天天基金網(wǎng)發(fā)布此信息目的在于傳播更多信息,與本網(wǎng)站立場無關(guān)。天天基金網(wǎng)不保證該信息(包括但不限于文字、數(shù)據(jù)及圖表)全部或者部分內(nèi)容的準(zhǔn)確性、真實(shí)性、完整性、有效性、及時(shí)性、原創(chuàng)性等。相關(guān)信息并未經(jīng)過本網(wǎng)站證實(shí),不對您構(gòu)成任何投資決策建議,據(jù)此操作,風(fēng)險(xiǎn)自擔(dān)。數(shù)據(jù)來源:東方財(cái)富Choice數(shù)據(jù)。

將天天基金網(wǎng)設(shè)為上網(wǎng)首頁嗎?      將天天基金網(wǎng)添加到收藏夾嗎?

關(guān)于我們|資質(zhì)證明|研究中心|聯(lián)系我們|安全指引|免責(zé)條款|隱私條款|風(fēng)險(xiǎn)提示函|意見建議|在線客服|誠聘英才

天天基金客服熱線:95021 |客服郵箱:vip@1234567.com.cn|人工服務(wù)時(shí)間:工作日 7:30-21:30 雙休日 9:00-21:30
鄭重聲明:天天基金系證監(jiān)會批準(zhǔn)的基金銷售機(jī)構(gòu)[000000303]。天天基金網(wǎng)所載文章、數(shù)據(jù)僅供參考,使用前請核實(shí),風(fēng)險(xiǎn)自負(fù)。
中國證監(jiān)會上海監(jiān)管局網(wǎng)址:www.csrc.gov.cn/pub/shanghai
CopyRight  上海天天基金銷售有限公司  2011-現(xiàn)在  滬ICP證:滬B2-20130026  網(wǎng)站備案號:滬ICP備11042629號-1

A
安聯(lián)基金安信基金
B
博道基金渤海匯金北京京管泰富基金百嘉基金貝萊德基金管理博時(shí)基金北信瑞豐寶盈基金博遠(yuǎn)基金
C
長安基金長城基金長城證券財(cái)達(dá)證券淳厚基金創(chuàng)金合信基金長江證券(上海)資管長盛基金財(cái)通基金財(cái)通資管誠通證券長信基金財(cái)信證券
D
德邦基金德邦證券資管大成基金東財(cái)基金達(dá)誠基金東方阿爾法基金東方紅資產(chǎn)管理東方基金東莞證券東?;?/a>東海證券東吳基金東吳證券東興基金東興證券第一創(chuàng)業(yè)東證融匯證券資產(chǎn)管理
F
富安達(dá)基金蜂巢基金富達(dá)基金(中國)富國基金富榮基金方正富邦基金方正證券
G
光大保德信基金國都證券廣發(fā)基金廣發(fā)資產(chǎn)管理國海富蘭克林基金國海證券國金基金國聯(lián)安基金國聯(lián)基金格林基金國聯(lián)民生國聯(lián)證券資產(chǎn)管理國融基金國壽安?;?/a>國泰海通資管國泰基金國投瑞銀基金國投證券國投證券資產(chǎn)管理國新國證基金國信證券國新證券股份國信證券資產(chǎn)管理工銀瑞信基金國元證券
H
華安基金匯安基金華安證券華安證券資產(chǎn)管理匯百川基金華寶基金華宸未來基金華創(chuàng)證券泓德基金華富基金匯豐晉信基金海富通基金宏利基金匯泉基金華潤元大基金華商基金惠升基金恒生前?;?/a>華泰柏瑞基金華泰保興基金紅土創(chuàng)新基金匯添富基金紅塔紅土華泰證券(上海)資產(chǎn)管理華夏基金華西基金華鑫證券合煦智遠(yuǎn)基金恒越基金弘毅遠(yuǎn)方基金
J
嘉合基金金融街證券景順長城基金嘉實(shí)基金九泰基金建信基金江信基金金信基金金鷹基金金元順安基金交銀施羅德基金
K
凱石基金
L
聯(lián)博基金路博邁基金(中國)
M
摩根基金(中國)摩根士丹利基金民生加銀基金明亞基金
N
諾安基金諾德基金南方基金南華基金南京證券農(nóng)銀匯理基金
P
平安基金鵬安基金管理平安證券鵬華基金浦銀安盛基金鵬揚(yáng)基金
Q
泉果基金前海開源基金前海聯(lián)合
R
人保資產(chǎn)瑞達(dá)基金融通基金睿遠(yuǎn)基金
S
上海光大證券資產(chǎn)管理上海海通證券資產(chǎn)管理上海證券施羅德基金(中國)申萬宏源證券申萬宏源證券資產(chǎn)管理申萬菱信基金蘇新基金山西證券上銀基金尚正基金山證(上海)資產(chǎn)管理
T
天風(fēng)(上海)證券資產(chǎn)管理天風(fēng)證券天弘基金泰康基金太平基金太平洋同泰基金泰信基金天治基金
W
萬家基金萬聯(lián)資管
X
西部利得基金西部證券湘財(cái)基金湘財(cái)證券信達(dá)澳亞基金信達(dá)證券先鋒基金新華基金興合基金興華基金西南證券新沃基金興業(yè)基金鑫元基金興銀基金管理興證全球基金興證資管
Y
英大基金易方達(dá)基金銀河金匯證券銀華基金銀河基金粵開證券益民基金易米基金圓信永豐基金永贏基金
Z
中庚基金中海基金中航基金中金財(cái)富中金公司中加基金中金基金中科沃土基金中歐基金朱雀基金招商基金浙商基金浙商證券資管招商證券資管中泰證券(上海)資管中信保誠基金中信建投中信建投基金中信證券中信證券資產(chǎn)管理中銀基金中郵基金中銀證券中原證券