通信世界網(wǎng)消息(CWW)一則看似平常的版本更新,讓整個(gè)AI圈驟然沸騰。
8月下旬,DeepSeek發(fā)布V3.1,大段更新說(shuō)明中鮮有人留意的“UE8M0 FP8參數(shù)精度”,卻在官方評(píng)論區(qū)被點(diǎn)出一句:UE8M0 FP8是針對(duì)即將發(fā)布的下一代國(guó)產(chǎn)芯片設(shè)計(jì)。
寥寥數(shù)字,卻瞬間點(diǎn)燃市場(chǎng)情緒。寒武紀(jì)股價(jià)盤(pán)中一度大漲近14%,總市值躍居科創(chuàng)板首位;半導(dǎo)體ETF半天上漲近6%,科創(chuàng)50指數(shù)創(chuàng)下三年半新高。國(guó)產(chǎn)芯片概念股集體狂飆,一場(chǎng)因技術(shù)細(xì)節(jié)而起的“漲停潮”在資本市場(chǎng)上演。
而另一邊,正值外界盛傳英偉達(dá)H20或?qū)⑼.a(chǎn)之際,這一“隱秘信號(hào)”更顯耐人尋味。它不僅意味著DeepSeek主動(dòng)貼合國(guó)產(chǎn)芯片的最佳性能點(diǎn),也被視作國(guó)產(chǎn)算力產(chǎn)業(yè)在關(guān)鍵時(shí)刻發(fā)出的軟硬協(xié)同沖鋒號(hào)。
那么,UE8M0 FP8究竟是什么?為何能提升國(guó)產(chǎn)芯片市場(chǎng)競(jìng)爭(zhēng)力?
UE8M0 FP8
為什么能點(diǎn)燃市場(chǎng)?
“UE8M0 FP8”其實(shí)是一種低精度浮點(diǎn)數(shù)的表達(dá)方式,看似只是編碼細(xì)節(jié),卻被視為國(guó)產(chǎn)芯片能追趕國(guó)際算力的重要抓手。為什么這么說(shuō)?先理解它的原理。
首先,UE8M0 FP8解決了“算力堵車”的問(wèn)題。
芯片就像一條高速公路,數(shù)據(jù)就是車流。傳統(tǒng)FP32數(shù)據(jù)“體積”很大,占用帶寬;FP16雖然小一半,但在大模型時(shí)代依然吃緊。FP8把數(shù)據(jù)壓縮到只有1/4 大小,同樣的公路,能跑更多車。而UE8M0則是FP8的一種“聰明壓縮法”,既保證精度不丟太多,又讓傳輸和計(jì)算更快。
而它和芯片的關(guān)系,就像油品和發(fā)動(dòng)機(jī)。
芯片是“發(fā)動(dòng)機(jī)”,數(shù)值格式就是“燃料”。如果芯片只能燒“汽油95”,那就跑不起來(lái)新能源車的性能。國(guó)產(chǎn)芯片過(guò)去主要支持FP16/INT8,但大模型訓(xùn)練和推理越來(lái)越依賴FP8。如果芯片和大模型不對(duì)齊,就像“油不對(duì)口”,性能發(fā)揮不出來(lái)。
DeepSeek這次主動(dòng)適配UE8M0,相當(dāng)于為國(guó)產(chǎn)芯片量身定制了“最合適的燃料”,讓它們能跑出接近國(guó)際頂尖的效果。
這也是為什么芯片廠商股價(jià)集體上漲。因?yàn)橘Y本市場(chǎng)的邏輯很簡(jiǎn)單,如果 DeepSeek這種大模型巨頭認(rèn)可并適配了某個(gè)精度標(biāo)準(zhǔn),而國(guó)產(chǎn)芯片廠商正好支持這個(gè)標(biāo)準(zhǔn),那就意味著他們有望和大模型生態(tài)“綁定”。未來(lái)推理、訓(xùn)練就能跑在國(guó)產(chǎn)硬件上,市場(chǎng)想象空間一下子打開(kāi)。
下一代國(guó)產(chǎn)芯片
誰(shuí)在“對(duì)號(hào)入座”?
在官方未明確點(diǎn)名的情況下,外界的目光迅速轉(zhuǎn)向了首批與DeepSeek宣布適配的8家廠商。
其中,市場(chǎng)最先聚焦的是寒武紀(jì)。理由在于其最新一代MLU370-S4、思元590與690系列均已支持FP8計(jì)算,并在低精度優(yōu)化方面走在前列。這也解釋了寒武紀(jì)股價(jià)率先出現(xiàn)大幅拉升。
與此同時(shí),海光、沐曦、中昊芯英、摩爾線程等廠商也被陸續(xù)點(diǎn)名:
? 海光深算三號(hào)DCU:已具備FP8能力,仍有優(yōu)化空間;
? 沐曦曦云C600:今年7月發(fā)布,強(qiáng)調(diào)FP8支持;
? 中昊芯英“剎那”TPU:定位高性能訓(xùn)練,原生支持FP8;
? 摩爾線程MTT S5000:國(guó)內(nèi)少數(shù)原生支持FP8的GPU。
此外,華為昇騰雖在當(dāng)前版本(910B/910C)尚未開(kāi)放FP8,但路線圖已明確“2025Q4原生FP8”,因此被普遍視為下一代的潛在落點(diǎn)。
在這種背景下,“下一代國(guó)產(chǎn)芯片”更像是一個(gè)面向未來(lái)的開(kāi)放信號(hào),而非單點(diǎn)指向。
從格式到生態(tài)
軟硬協(xié)同的“臨界點(diǎn)”
那么,這和英偉達(dá)H20停產(chǎn)有什么關(guān)系?
過(guò)去大家最擔(dān)心的是,如果英偉達(dá)對(duì)中國(guó)的芯片供貨受限,大模型是不是就會(huì)“沒(méi)飯吃”?而現(xiàn)在,DeepSeek通過(guò)UE8M0 FP8給國(guó)產(chǎn)芯片打了一個(gè)“強(qiáng)心針”,哪怕H20停了,國(guó)產(chǎn)GPU/NPU只要支持這個(gè)新精度,就能跑得動(dòng)DeepSeek這樣的大模型。
過(guò)去,國(guó)產(chǎn)加速器多以FP16/BF16+INT8為主流通路,精度選擇與主流國(guó)際生態(tài)存在差距。如今,隨著UE8M0 FP8被引入,國(guó)產(chǎn)廠商得以與DeepSeek這樣的頭部大模型在精度格式上形成共識(shí)。
這至少意味著以下三點(diǎn)。
一是算力利用率提高:帶寬受限的情況下,F(xiàn)P8+UE8M0能跑更大模型;
二是生態(tài)效應(yīng)增強(qiáng):DeepSeek主動(dòng)適配,類似于為國(guó)產(chǎn)芯片量身定制“性能放大器”;
三是產(chǎn)業(yè)鏈協(xié)同:國(guó)內(nèi)廠商在統(tǒng)一精度規(guī)范下,形成類似 “Wintel” 的共生關(guān)系。
從長(zhǎng)遠(yuǎn)看,這不僅關(guān)乎模型的推理和訓(xùn)練效率,更可能成為減少對(duì)國(guó)外算力依賴、提升國(guó)產(chǎn)芯片市場(chǎng)競(jìng)爭(zhēng)力的現(xiàn)實(shí)路徑。
換句話說(shuō),不是只能靠別人,國(guó)產(chǎn)替代真的有了“可落地的可能”。
微妙的“點(diǎn)火”時(shí)刻
值得注意的是,DeepSeek在官方更新說(shuō)明正文里,只字未提UE8M0 FP8的宏大意義,僅用一句話帶過(guò):“DeepSeek-V3.1使用了UE8M0 FP8 Scale的參數(shù)精度。”
真正的“火種”藏在評(píng)論區(qū)的一句話。
或許是有意,或許是無(wú)心。但不可否認(rèn),市場(chǎng)的劇烈反應(yīng)已說(shuō)明一切。畢竟,回顧過(guò)去幾年,國(guó)產(chǎn)芯片更多扮演的是“補(bǔ)位”角色:在高端算力受限時(shí)填補(bǔ)空缺。外界對(duì)其期待常常停留在“能否替代英偉達(dá)”的層面。
而這一次,隨著UE8M0 FP8的引入,局面正在發(fā)生變化。它不僅是一種壓縮格式的升級(jí),更是一次大模型與芯片之間的精度共識(shí),標(biāo)志著國(guó)產(chǎn)算力開(kāi)始擁有屬于自己的 生態(tài)話語(yǔ)權(quán)。當(dāng)DeepSeek這樣的大模型主動(dòng)“貼近”國(guó)產(chǎn)芯片性能點(diǎn)時(shí),軟硬協(xié)同的格局已悄然成型,它意味著國(guó)產(chǎn)AI正在重新定義算力生態(tài)規(guī)則。
無(wú)論英偉達(dá)H20是否停產(chǎn),國(guó)產(chǎn)AI的進(jìn)程都將不再依賴單一供應(yīng)商的“天平傾斜”。真正決定產(chǎn)業(yè)走向的,是能否形成大模型與國(guó)產(chǎn)硬件深度綁定的合力。
一段浮點(diǎn)精度的技術(shù)細(xì)節(jié),背后是國(guó)產(chǎn)AI從補(bǔ)位走向重構(gòu)的戰(zhàn)略拐點(diǎn)。
- QQ:61149512