千卡損耗不超5% 揭秘百度“萬(wàn)源”O(jiān)S攻克一云多芯難題的技術(shù)硬核
從技術(shù)、功能、性能、產(chǎn)品、平臺(tái),到系統(tǒng)定位、目標(biāo)受眾,再到商業(yè)和生態(tài)打造,萬(wàn)源”已顛覆傳統(tǒng)云計(jì)算,并為開(kāi)發(fā)者們創(chuàng)造更大的智能底座。
2024-04-25 10:22:40
來(lái)源:通信世界全媒體 通信世界全媒體??

通信世界網(wǎng)消息(CWW)近年來(lái),無(wú)論是Client端PC、手機(jī),還是Server端DC,都隨著數(shù)據(jù)的爆炸而快速變化。然而,在這當(dāng)中,芯片、OS的核心基座作用卻從未改變。從PC時(shí)代的WinTel聯(lián)盟,到移動(dòng)互聯(lián)時(shí)代的Android、高通,從傳統(tǒng)DC的x86 、Linux,到云計(jì)算時(shí)代的Arm、云OS,二者相互依賴或同時(shí)升級(jí)亦或交叉演進(jìn),如影隨形。

今天,隨著AI大模型的到來(lái),當(dāng)GPU、NPU,尤其是GPU逐漸占據(jù)上風(fēng)并挑戰(zhàn)了CPU的霸主存在時(shí),全新OS的出現(xiàn)成為必需又恰逢其時(shí)。4月16日,在Create 2024 百度AI開(kāi)發(fā)者大會(huì)上,百度集團(tuán)執(zhí)行副總裁、百度智能云事業(yè)群總裁沈抖正式發(fā)布新一代智能計(jì)算操作系統(tǒng)——萬(wàn)源。

“傳統(tǒng)的云計(jì)算系統(tǒng)依然重要,但不再是主角,我們需要一個(gè)全新的操作系統(tǒng),對(duì)新的計(jì)算平臺(tái),也就是智能計(jì)算做好抽象和封裝,重新定義人機(jī)交互,為開(kāi)發(fā)者提供更簡(jiǎn)單、更流暢的開(kāi)發(fā)體驗(yàn)?!鄙蚨度缡钦f(shuō)。

(百度集團(tuán)執(zhí)行副總裁、百度智能云事業(yè)群總裁沈抖)

在沈抖看來(lái),隨著大模型技術(shù)的不斷演進(jìn),通過(guò)自然語(yǔ)言進(jìn)行編程正在成為現(xiàn)實(shí)。編程將不再面向過(guò)程或者面向?qū)ο?,而是面向需求;編程的過(guò)程將成為開(kāi)發(fā)者表達(dá)愿望的過(guò)程,并為操作系統(tǒng)帶來(lái)革命性的變化。在操作系統(tǒng)的內(nèi)核中,底層硬件從以CPU算力為主變成以GPU算力為主,并且新增了被大模型壓縮的世界知識(shí)。操作系統(tǒng)管理的對(duì)象發(fā)生了本質(zhì)的變化,從管理進(jìn)程、管理微服務(wù),進(jìn)化為管理智能。

確實(shí),百度對(duì)“萬(wàn)源”定位是清晰精準(zhǔn)的,底層對(duì)象是GPU,產(chǎn)品內(nèi)核在資源管理上從管理進(jìn)程、管理微服務(wù),變成了管理智能,新增了被大模型壓縮的世界知識(shí),部署在服務(wù)端,重新定義人機(jī)交互,面向開(kāi)發(fā)者提供更簡(jiǎn)便流暢的環(huán)境和接口。

“萬(wàn)源”極其重視開(kāi)發(fā)者生態(tài)的培育,百度集團(tuán)副總裁侯震宇在接受媒體采訪時(shí)解釋說(shuō)到,操作系統(tǒng)的成功不只是技術(shù)上的成功,十幾年前在智能手機(jī)剛出來(lái)的時(shí)候,不只有安卓,大批的Symbian OS、BlackBerry OS,甚至是Windows 移動(dòng)端OS出現(xiàn),但最后只有Android贏得勝利,“得開(kāi)發(fā)者得天下”。

(百度集團(tuán)副總裁侯震宇)

而無(wú)論百度如何定義自已的“萬(wàn)源”,對(duì)底層資源的管理分配調(diào)度,還是對(duì)上層應(yīng)用的完美支撐適配,以及生態(tài)的打造,歸根到底還得憑借強(qiáng)大的底層技術(shù),才能支撐起全新的智能計(jì)算的“大廈”。

底座強(qiáng)則萬(wàn)物孕育,花開(kāi)葉茂。侯震宇帶我們一道,揭開(kāi)了“萬(wàn)源”的三層架構(gòu),以及“萬(wàn)源”如何攻克“一云多芯”難題的背后技術(shù)硬核。

“萬(wàn)源”三層架構(gòu)

在了解“萬(wàn)源”技術(shù)實(shí)力之前,我們有必要先來(lái)了解下它的三層架構(gòu)。

據(jù)了解,百度智能云全新推出的“萬(wàn)源”智能計(jì)算操作系統(tǒng)主要由Kernel(內(nèi)核)、Shell(外殼)、Toolkit(工具)三層構(gòu)成,底層屏蔽掉云原生系統(tǒng)與異構(gòu)算力的復(fù)雜性,上層則為AI原生應(yīng)用的敏捷開(kāi)發(fā)提供支撐與保障。

(萬(wàn)源架構(gòu)圖)

首先,在內(nèi)核層,在算力資源管理方面,百度百舸·AI異構(gòu)計(jì)算平臺(tái)針對(duì)大模型訓(xùn)練、推理等任務(wù),對(duì)智算集群的設(shè)計(jì)、調(diào)度、容錯(cuò)等環(huán)節(jié)進(jìn)行了專項(xiàng)優(yōu)化。目前,百舸能夠?qū)崿F(xiàn)萬(wàn)卡集群上的模型有效訓(xùn)練時(shí)長(zhǎng)占比超過(guò)98.8%,線性加速比、帶寬有效性分別高達(dá)95%,算力效能業(yè)界領(lǐng)先。

此外,百舸還兼容昆侖芯、昇騰、海光DCU、英偉達(dá)、英特爾等國(guó)內(nèi)外主流AI芯片,支持用戶以最小代價(jià)完成算力適配。

萬(wàn)源內(nèi)核中的另一個(gè)重要組成部分是大模型。大模型能夠?qū)⒕蘖康氖澜缰R(shí)進(jìn)行高效壓縮,并將自然語(yǔ)言的理解、生成、邏輯、記憶能力進(jìn)行封裝。目前,萬(wàn)源內(nèi)核中既包含了業(yè)界領(lǐng)先的ERNIE 4.0、ERNIE 3.5大語(yǔ)言模型,也包括ERNIE Speed/Lite/Tiny等輕量級(jí)模型、文心視覺(jué)大模型和各具特色的第三方大模型。它們壓縮并封裝了龐大的世界知識(shí),是更上層運(yùn)行簡(jiǎn)單接口和 AI 原生應(yīng)用的能力源泉。

在內(nèi)核層之上是Shell層,通過(guò)百度智能云千帆ModelBuilder解決內(nèi)核中模型的管理、調(diào)度、二次開(kāi)發(fā)等問(wèn)題,屏蔽掉模型開(kāi)發(fā)的復(fù)雜性,幫助更多人只投入少量的數(shù)據(jù)、資源和精力,就能快速精調(diào)出適合自己業(yè)務(wù)的模型。同時(shí),在實(shí)際應(yīng)用中,千帆ModelBuidler提供的模型路由服務(wù),能夠自動(dòng)為不同難度的任務(wù)選擇合適參數(shù)規(guī)模的模型,給出平衡效果與成本的最優(yōu)模型組合。經(jīng)測(cè)算,在模型效果基本持平的情況下,模型路由平均降低推理成本多達(dá)30%!

據(jù)了解,千帆大模型平臺(tái)不僅支持百度自研的文心大模型系列,而且支持BLOOM、Llama2等60+國(guó)內(nèi)外第三方大模型的開(kāi)發(fā)及應(yīng)用,模型數(shù)量國(guó)內(nèi)第一。

在Shell層之上,千帆AppBuilder和AgentBuilder共同構(gòu)成了工具層,為開(kāi)發(fā)者提供強(qiáng)大的AI原生應(yīng)用開(kāi)發(fā)能力。尤其是千帆AppBuilder提供的工作流編排功能,支持開(kāi)發(fā)者使用預(yù)置的模板和組件,輕松定制自己的業(yè)務(wù)流程,還能夠集成、擴(kuò)建自己的特色組件,在不同節(jié)點(diǎn)上選用適合的模型,通過(guò)靈活的編排實(shí)現(xiàn)業(yè)務(wù)邏輯。

目前,千帆大模型平臺(tái)已經(jīng)服務(wù)了 8.5 萬(wàn)家企業(yè)客戶,并累計(jì)精調(diào)超過(guò) 1.4 萬(wàn)個(gè)模型。AI 原生應(yīng)用開(kāi)發(fā)平臺(tái)千帆 AppBuilder 全面開(kāi)放服務(wù),讓人人都能自己開(kāi)發(fā)。目前已經(jīng)有 8100 家伙伴通過(guò)該平臺(tái)開(kāi)發(fā) AI 原生應(yīng)用。

在千帆AppBuilder上開(kāi)發(fā)AI原生應(yīng)用的過(guò)程中,還可以直接調(diào)用通過(guò)千帆ModelBuilder精調(diào)過(guò)的模型,讓整個(gè)開(kāi)發(fā)過(guò)程變得極為流暢和便捷。在應(yīng)用開(kāi)發(fā)完成后,可以一鍵發(fā)布到百度搜索、微信公眾號(hào)等平臺(tái),也可以通過(guò)API或SDK的方式直接集成到用戶自己的系統(tǒng)中,真正做到極速開(kāi)發(fā)、輕松上市。

目前,Toolkit層工具組件擴(kuò)增至54個(gè),包括數(shù)十個(gè)大模型能力組件、AI能力組件以及百度自有的搜索組件等,為開(kāi)發(fā)者提供了更加豐富、便捷的開(kāi)發(fā)工具。

“我們把最底層的百舸大異構(gòu)的集群,在中間層內(nèi)嵌了百度文心一言大模型,當(dāng)然也支持包括國(guó)內(nèi)外其他78+大模型的千帆大模型平臺(tái),特別是千帆的ModelBulider,共同構(gòu)成了一個(gè)內(nèi)核,由百舸、千帆發(fā)展成整個(gè)萬(wàn)源操作系統(tǒng)。”侯震宇說(shuō)道,它并不是說(shuō)一蹴而就,而是我們過(guò)去這么多年工作以及多年幫助客戶解決問(wèn)題積累出來(lái)的一個(gè)大型的操作系統(tǒng),萬(wàn)源首先是面向公有云環(huán)境,把所有的東西幫助大家“屏蔽”掉,當(dāng)硬件和模型快速發(fā)展時(shí),我們有能力給開(kāi)發(fā)者提供一個(gè)更加簡(jiǎn)潔、方便的開(kāi)發(fā)工具、開(kāi)發(fā)語(yǔ)言,所以這時(shí)候“萬(wàn)源”也就應(yīng)運(yùn)而生了。

侯震宇表示,希望在萬(wàn)源的“黑土地”上能夠長(zhǎng)出來(lái)更多的應(yīng)用,百度會(huì)自己做一些應(yīng)用,但不會(huì)和真正的、潛在的合作伙伴以及潛在客戶去搶應(yīng)用。就像蘋果,它會(huì)做一些它自己原生的應(yīng)用,但它不會(huì)去跟其它家做競(jìng)爭(zhēng)。

一云多芯 攻克極難攻堅(jiān)的難題

在百度的解釋中,AI原生時(shí)代的全新操作系統(tǒng),需要管理萬(wàn)卡規(guī)模的集群,極致發(fā)揮CPU、GPU性能 ,高速互聯(lián);需要強(qiáng)大的大模型(大語(yǔ)言模型、CV大模型)作為核心引擎;需要構(gòu)建強(qiáng)大的大模型服務(wù)能力,并提供模型精調(diào)、評(píng)估、部署、服務(wù)的工具鏈;需要有好用的應(yīng)用開(kāi)發(fā)工具去做工作流編排、插件管理,簡(jiǎn)化開(kāi)發(fā)流程;同時(shí)保證安全和運(yùn)維,要隱藏掉上一代云原生系統(tǒng)的復(fù)雜性,加速AI原生應(yīng)用的爆發(fā)……

當(dāng)下,全球芯片供應(yīng)存在多種不確定性,導(dǎo)致多種算力芯片并存的格局。這對(duì)智算集群中模型推理和單一任務(wù)訓(xùn)練提出了挑戰(zhàn)。侯震宇介紹,相比模型推理,“一云多芯”在模型訓(xùn)練場(chǎng)景中是極難攻堅(jiān)的難題,主要包含兩類細(xì)分場(chǎng)景:

一是智算集群中存在多個(gè)訓(xùn)練任務(wù),單一廠商芯片只服務(wù)單一任務(wù);

二是在每個(gè)獨(dú)立的模型訓(xùn)練任務(wù)中同時(shí)使用不同廠商芯片。這就需要解決不同廠商芯片算力均勻切分、芯片間通信效率優(yōu)化等問(wèn)題,難度極高。

image.png

(業(yè)界領(lǐng)先的單一任務(wù)一云多芯大模型訓(xùn)練解決方案)

目前,百舸已經(jīng)實(shí)現(xiàn)了單一訓(xùn)練任務(wù)下不同廠商芯片的混合訓(xùn)練,且百卡規(guī)模性能損失不超過(guò)3%,千卡規(guī)模性能損失不超過(guò)5%,業(yè)界領(lǐng)先。最大程度上屏蔽硬件之間差異,幫助用戶擺脫單一芯片的依賴,實(shí)現(xiàn)更優(yōu)成本,打造更具彈性的供應(yīng)鏈體系。

侯震宇分析說(shuō),“以CPU+GPU為代表的異構(gòu)計(jì)算正在成為主流,但大模型場(chǎng)景的異構(gòu)計(jì)算難度很高,不同的芯片之間很難互聯(lián),且不同芯片間沒(méi)法在同一張網(wǎng)里面跑同一個(gè)任務(wù)”這是之前大家一貫的觀點(diǎn)。因?yàn)榘俣韧度階I十幾年,我們的AI基礎(chǔ)設(shè)施積累的時(shí)間很長(zhǎng),所以在去年基本上就已經(jīng)攻克了這個(gè)問(wèn)題,在今天把它公布出來(lái)。

這里面涉及到多個(gè)層次的問(wèn)題。

第一步,需要能夠讓不同的芯片自身跑起來(lái),百舸AI異構(gòu)計(jì)算平臺(tái)的線性加速比現(xiàn)在達(dá)到95%以上。這要?dú)w功于百度智能云面向 AI 計(jì)算推出的 AI 加速套件「AIAK」,它的核心是網(wǎng)絡(luò)通信加速。AI、大模型能夠跑到芯片上基本都是一些算子,每家芯片廠商的算子實(shí)現(xiàn),其實(shí)并不一樣,需要在整個(gè)框架層面上把底層通信和上層算子的優(yōu)化實(shí)現(xiàn)拆開(kāi),這樣各家芯片針對(duì)算子進(jìn)行優(yōu)化,百度在把底下的通訊庫(kù)做好,不管什么樣的芯片首先都能夠跑在百度的加速庫(kù)上。

據(jù)了解,算子是指支持DNN模型訓(xùn)練與推理的基本運(yùn)算單元及組合,比如conv2d,matmul。深度模型由pytorch,TF等上層框架表達(dá)實(shí)現(xiàn),一般人并不關(guān)心它們是如何由具體的硬件實(shí)現(xiàn)的。實(shí)際上,這些模型在硬件執(zhí)行前首先經(jīng)過(guò)圖級(jí)優(yōu)化,分解為一個(gè)個(gè)算子。算子如何適配具體芯片的特點(diǎn)需要針對(duì)硬件特性仔細(xì)安排。對(duì)于AI芯片公司來(lái)說(shuō),其芯片都有自己的硬件架構(gòu)和特性。因此為了讓DNN模型在自己芯片運(yùn)行和發(fā)揮最佳性能,就需要定制自己的算子庫(kù)。

第二步,基于第一步,把不同的芯片都混合在同樣的一張算力網(wǎng)里面,跑在同一個(gè)模型訓(xùn)練任務(wù)上。不同的芯片涉及不同的算力能力、性能,對(duì)通訊、存儲(chǔ)的要求以及最終的體驗(yàn)都不一樣。百度在整個(gè)的底層的百舸加速庫(kù)上,又做了并行框架的實(shí)現(xiàn)。百度自研的自適應(yīng)算法,可以根據(jù)當(dāng)下整個(gè)網(wǎng)絡(luò)里面各種芯片及配比的不同,來(lái)自動(dòng)實(shí)現(xiàn)TP(張量模型并行)、MP(模型并行)、PP(流水線并行)的不同的并行策略和參數(shù)設(shè)定。

侯震宇說(shuō)到,這期間也遇到了一些非常細(xì)的和很難的技術(shù)問(wèn)題。比如GPU卡間通信主要是用NVLink實(shí)現(xiàn),但是卡出了機(jī)器之后走的RDMA網(wǎng)絡(luò)或者IB網(wǎng)絡(luò)。Nvidia GPU和百度昆侖芯,可以通過(guò)標(biāo)準(zhǔn)的網(wǎng)絡(luò)協(xié)議RDMA去實(shí)現(xiàn)?!暗恍┨厥獾男酒鐣N騰把在網(wǎng)卡上實(shí)現(xiàn)的RDMA能力,集成到的芯片中,這就不是標(biāo)準(zhǔn)的網(wǎng)卡實(shí)現(xiàn),我們會(huì)把這一層‘屏蔽’掉,采用把它復(fù)制到CPU,用CPU來(lái)做轉(zhuǎn)發(fā)的實(shí)現(xiàn)策略?!?/p>

“單個(gè)任務(wù)能夠用不同的芯片實(shí)現(xiàn)是一種非常難的技術(shù),而這也是接下來(lái)多元芯片終將要面對(duì)的問(wèn)題,我們已經(jīng)先把這個(gè)問(wèn)題解決掉了”。侯震宇補(bǔ)充說(shuō)道。

簡(jiǎn)單來(lái)說(shuō),百卡和千卡規(guī)模性能損失低,得益于百舸在存儲(chǔ)方面支持了高性能分布式存儲(chǔ) PFS、以及萬(wàn)卡級(jí)別的 RDMA 網(wǎng)絡(luò),前者顯著提升訓(xùn)練和推理過(guò)程中的 I/O 吞吐能力,后者有效降低網(wǎng)絡(luò)延遲。

破解技術(shù)難題,為開(kāi)發(fā)者提供更簡(jiǎn)單、更流暢的開(kāi)發(fā)體驗(yàn)等,是“萬(wàn)源”獲得客戶青睞的一大主要原因。正如沈抖所說(shuō),從內(nèi)核到Shell、再到應(yīng)用開(kāi)發(fā)工具,萬(wàn)源已經(jīng)實(shí)現(xiàn)了層與層的有機(jī)結(jié)合、端到端的效能優(yōu)化。過(guò)去一年多,在內(nèi)外部客戶的實(shí)際應(yīng)用中,不斷打磨、持續(xù)完善,“萬(wàn)源”,已經(jīng)成為AI原生時(shí)代的智能計(jì)算操作系統(tǒng),為用戶提供極簡(jiǎn)的開(kāi)發(fā)體驗(yàn)、智能的系統(tǒng)內(nèi)核,和高效的異構(gòu)算力。

萬(wàn)源的發(fā)布是一個(gè)起點(diǎn)。未來(lái),百度智能云會(huì)進(jìn)一步開(kāi)放操作系統(tǒng)層面的生態(tài)合作。向上,開(kāi)放更多的能力和接口,開(kāi)發(fā)者可以非常簡(jiǎn)單地開(kāi)發(fā)應(yīng)用。向左,企業(yè)可以用萬(wàn)源做基礎(chǔ)、打造適合自己的垂直行業(yè)的操作系統(tǒng)。向右,可以把萬(wàn)源直接部署在自己的智算中心,享受穩(wěn)定、安全、高效的智能計(jì)算平臺(tái)。向下,適配更多的芯片,為開(kāi)發(fā)者進(jìn)一步隱去異構(gòu)集群的復(fù)雜性,讓不同的芯片都能發(fā)揮最大的效能。

從技術(shù)、功能、性能、產(chǎn)品、平臺(tái),到系統(tǒng)定位、目標(biāo)受眾,再到商業(yè)和生態(tài)打造,萬(wàn)源”已顛覆傳統(tǒng)云計(jì)算,并為開(kāi)發(fā)者們創(chuàng)造更大的智能底座。

最新文章
1
海信家電2024年報(bào):新風(fēng)空調(diào)市占率第一 進(jìn)入AI空氣管家時(shí)代
2
2025快手磁力大會(huì):加速“生成新商業(yè)”,AI全面重塑商業(yè)經(jīng)營(yíng)
3
三星推出AI神家電,中國(guó)家電的AI智慧生活解決方案何時(shí)到來(lái)?
4
索尼集團(tuán)成員Aniplex上海線下店煥新開(kāi)業(yè),開(kāi)創(chuàng)IP+沉浸互動(dòng)新空間
5
2025中國(guó)國(guó)際消費(fèi)電子博覽會(huì)(CICE)德國(guó)推介會(huì)在柏林成功舉辦
6
DeepSeek的低成本神話后,云大廠們?yōu)楹芜€要增加算力投入
7
AI智啟生活 第15屆深圳國(guó)際移動(dòng)電子展亮點(diǎn)“劇透”
8
4年前理想李想和特斯拉陶琳說(shuō)的話,值得所有人深思
9
TCL上新Mini LED電視,T7L為何“最能打”,Q9L為何“最值得買”?
10
八年前用A9帶火屏幕發(fā)聲技術(shù)的索尼,今年會(huì)有OLED新品嗎?
11
海信視像發(fā)布2024年可持續(xù)發(fā)展報(bào)告:以綠色科技推動(dòng)可持續(xù)發(fā)展
12
都叫“養(yǎng)鮮”冰箱,格力、容聲有啥不一樣?
13
財(cái)報(bào)觀察:2024全球智能家電銷量第一品牌,講好新故事?
14
續(xù)航滅霸 +倍強(qiáng)大 vivo Y300 Pro+正式發(fā)布
15
BOE(京東方)f-OLED柔性顯示技術(shù)策源地論壇舉辦 攜手中關(guān)村論壇共筑科技創(chuàng)新高地
16
海信視像2024年?duì)I收凈利雙增,高端穩(wěn)步增長(zhǎng),蟬聯(lián)世界第二
17
精裝修熱水系統(tǒng)市場(chǎng)外資占優(yōu),高端住宅需求點(diǎn)燃新增長(zhǎng)(2025年1-2月)
18
AI家電:技術(shù)狂歡還是實(shí)用革命?
19
中國(guó)半導(dǎo)體并購(gòu)潮起
20
小家電市場(chǎng)表現(xiàn)低迷,2025年小家電市場(chǎng)面臨嚴(yán)峻挑戰(zhàn)
關(guān)于我們

微信掃一掃,加關(guān)注

商務(wù)合作
  • QQ:61149512