AI算力龍頭英偉達攜手云計算王者亞馬遜云科技,共同加速AI創(chuàng)新
1956年那個燥熱的夏季,寧靜的漢諾斯小鎮(zhèn)里,那場在后來相當知名的“達特茅斯會議”,雖然敲定了“人工智能”作為“用機器來模仿人類學習以及其他方面的智能”的技術的代名詞,但是對它的未來,應該是沒有明確預判的。那些當時的行業(yè)“超腦”沒有想到,“人工智能”在此后的幾十年里波浪式前進、階段性停滯、多次修正,并在某一個階段突然爆發(fā)式崛起,而諸如“大模型”、“生成式”這樣的術語,在那時,是未被討論、規(guī)劃甚至設想過的:在2020年之后,“人工智能”不僅有了真正的“靴子落地”的傾向,而且“腳印”加深,“腳步”加快。 特別是在Transformer出現(xiàn)后,大模型的規(guī)模平均每隔半年就會翻倍。目前,OpenAI最先進的大模型有1.8萬億參數(shù),而前述擴張速度或許代表,這種參數(shù)規(guī)模,對于未來,仍然不過是個“開始”。這個時候,壓力就越來越明確地給到了“算力”。 在英偉達 GTC 2024的主旨演講中,英偉達創(chuàng)始人兼首席執(zhí)行官黃仁勛表示,如果用一顆petaflop(每秒鐘可進行1千萬億次運算)量級的GPU來應對前述大模型需要的計算規(guī)模,用時約1000年,“不夠快”,“不夠大”。 也是基于此,GTC 2024現(xiàn)場發(fā)布Blackwell GPU,AI性能達到20 petaflops,相比作為主要面向大規(guī)模AI和HPC應用的英偉達第九代數(shù)據(jù)中心GPU的Hopper,Blackwell的AI性能提升5倍,片上存儲
原創(chuàng)
2024-04-01 14:09:39
來源:丁科技網(wǎng)??
作者:建輝

1956年那個燥熱的夏季,寧靜的漢諾斯小鎮(zhèn)里,那場在后來相當知名的“達特茅斯會議”,雖然敲定了“人工智能”作為“用機器來模仿人類學習以及其他方面的智能”的技術的代名詞,但是對它的未來,應該是沒有明確預判的。那些當時的行業(yè)“超腦”沒有想到,“人工智能”在此后的幾十年里波浪式前進、階段性停滯、多次修正,并在某一個階段突然爆發(fā)式崛起,而諸如“大模型”、“生成式”這樣的術語,在那時,是未被討論、規(guī)劃甚至設想過的:在2020年之后,“人工智能”不僅有了真正的“靴子落地”的傾向,而且“腳印”加深,“腳步”加快。

特別是在Transformer出現(xiàn)后,大模型的規(guī)模平均每隔半年就會翻倍。目前,OpenAI最先進的大模型有1.8萬億參數(shù),而前述擴張速度或許代表,這種參數(shù)規(guī)模,對于未來,仍然不過是個“開始”。這個時候,壓力就越來越明確地給到了“算力”。

在英偉達 GTC 2024的主旨演講中,英偉達創(chuàng)始人兼首席執(zhí)行官黃仁勛表示,如果用一顆petaflop(每秒鐘可進行1千萬億次運算)量級的GPU來應對前述大模型需要的計算規(guī)模,用時約1000年,“不夠快”,“不夠大”。

也是基于此,GTC 2024現(xiàn)場發(fā)布Blackwell GPU,AI性能達到20 petaflops,相比作為主要面向大規(guī)模AI和HPC應用的英偉達第九代數(shù)據(jù)中心GPU的Hopper,Blackwell的AI性能提升5倍,片上存儲提升4倍。同時,包含多項計算加速技術。黃仁勛說,“Hopper很棒,但我們需要更大的GPU”,Blackwell就“非常非常大”。

外界將Blackwell稱之為“算力核彈”。

不過,正如“核彈”需要很好的“發(fā)射平臺”,要推動AI創(chuàng)新領域的“算力引爆”,英偉達并不是“一個人在戰(zhàn)斗”,與之攜手、提供優(yōu)秀“平臺”的,是與英偉達有13年合作歷程的亞馬遜云科技。后者致力于讓最先進的AI算力在云端觸手可得,Blackwell GPU平臺即將登陸亞馬遜云科技,亞馬遜云科技將提供NVIDIA GB200 Grace Blackwell 超級芯片和 B100 Tensor Core GPU。

具體而言,雙方的延伸合作,在AI前沿技術探索的規(guī)模、性能、安全、應用等維度亮點突出。

在云上加速超萬億級參數(shù)大模型研發(fā)

從黃仁勛的言語間,不難看到,英偉達Blackwell,劍指萬億參數(shù)規(guī)模大模型。

Blackwell架構下的新品NVIDIA GB200,包含兩個B200 GPU(單個包含2080億個晶體管)和一個Grace CPU,在具有1750億個參數(shù)的GPT-3大語言模型基準測試中,GB200性能是H100的7倍,訓練速度是H100的4倍,成本和能耗上GB200比H100降低了25倍。

亞馬遜云科技將提供配置GB200 NVL72的英偉達Blackwell平臺,該平臺具備配備72顆Blackwell GPU和36顆Grace CPU,通過第五代NVIDIA NVLink?互連。亞馬遜云科技則在云中為其提供強大的EFA網(wǎng)絡連接、高級虛擬化的Amazon Nitro系統(tǒng)和Amazon EC2 UltraClusters超大規(guī)模集群等技術支持,客戶能夠在亞馬遜云科技上擴展至數(shù)千個GB200 Superchips。

亞馬遜云科技還計劃提供配備基于新的英偉達B100 GPU的Amazon EC2實例,并能夠在Amazon EC2 UltraClusters中進行大規(guī)模部署。此前,亞馬遜云科技已經成功推出了基于英偉達H100芯片的Amazon EC2 P5實例,客戶能夠在云上將其P5實例擴展到超過2萬個英偉達H100 GPU,后續(xù)還提供可短期使用這些實例的EC2 Capacity Blocks for ML功能,以幫助客戶更好地安排云上生成式AI開發(fā)進程。

GB200芯片同時也在亞馬遜云科技和英偉達共同開發(fā)的AI平臺NVIDIA DGX? Cloud上可用,這是一個在亞馬遜云科技上雙方共同開發(fā)的AI平臺,為企業(yè)開發(fā)者提供了構建和部署先進生成式AI模型所需的專用基礎設施和軟件。

綜上來看,亞馬遜云科技通過對英偉達的Blackwell GPU的支持,在應對資源密集型和數(shù)萬億參數(shù)語言模型等推理工作負載加速方面實現(xiàn)了巨大飛躍。

Ceiba性能翻6倍,助力更多領域創(chuàng)新

在去年11月底亞馬遜云科技2023 re:Invent全球大會上,Ceiba首次亮相,是當時英偉達與亞馬遜云科技合作建造的世界上最快的AI超級計算機之一,當時的計算性能為65exaflops,,專為英偉達自身的研究和開發(fā)而設計,并獨家托管在亞馬遜云科技上。

伴隨Blackwell出現(xiàn),Ceiba項目迎來新進展,將采用GB200芯片進行設計。新的Ceiba項目擁有20736顆B200 GPU的超級計算機,采用新型NVIDIA GB200 NVL72系統(tǒng)構建,該系統(tǒng)利用第五代NVLink技術連接10368顆NVIDIA Grace CPU。系統(tǒng)還通過亞馬遜云科技的第四代EFA網(wǎng)絡進行擴展,為每個Superchip提供高達800Gbps的低延遲、高帶寬網(wǎng)絡吞吐量,能夠處理高達414exaflops的AI計算量。

這與之前計劃在Hopper架構上構建的Ceiba相比,性能翻了6倍。

以此為依托,英偉達將基于Ceiba項目推進大語言模型、圖形(圖像/視頻/3D 生成)與仿真、數(shù)字生物學、機器人技術、自動駕駛汽車、NVIDIA Earth-2 氣候預測等領域的 AI 技術,從而推動更多領域的生成式 AI 創(chuàng)新。

生成式AI開發(fā)安全更進一步

類型、規(guī)模龐大的安全問題,在近年來與大模型、生成式AI探索幾乎相伴而生。通過合作,亞馬遜云科技與英偉達繼續(xù)強化了生成式AI的安全性。

一方面,英偉達也在Blackwell架構中增加了機密計算功能來強化AI的安全性。另一方面,Blackwell架構包含了可靠性引擎RAS,該引擎通過AI對可靠性、安全性等相關問題進行預測和預先診斷,在穩(wěn)固運行的同時進一步降低運營成本。

至于亞馬遜云科技,首先,堅持客戶擁有并能夠始終控制其數(shù)據(jù),并確保數(shù)據(jù)不會與第三方模型提供者共享。

其次,Amazon Nitro系統(tǒng)與英偉達GB200結合能夠阻止未授權個體訪問模型權重。

GB200支持對GPU間的NVLink連接物理加密以及CPU和GPU間的數(shù)據(jù)傳輸加密,同時還能夠利用Amazon EFA對分布式訓練和推理過程的數(shù)據(jù)進行加密。

受益于Amazon Nitro系統(tǒng),GB200系統(tǒng)能夠將CPU和GPU的輸入/輸出功能卸載至專門的硬件中,以提供更加一致的性能,其增強的安全性可以在客戶端和云端全程保護客戶的代碼和數(shù)據(jù)在處理過程中的安全。

推進生成式AI在生命健康領域的應用

亞馬遜云科技與英偉達在利用計算機輔助的藥物發(fā)現(xiàn)領域進行合作拓展,推出了新的NVIDIA BioNeMo?基礎模型,用于生成化學、蛋白質結構預測,以及理解藥物分子與目標的相互作用,這些新模型將很快在Amazon HealthOmics上提供。

Amazon HealthOmics是一個專為幫助醫(yī)療保健和生命科學組織存儲、查詢和分析基因組、轉錄組及其他組學數(shù)據(jù)而設計的專用服務。

Amazon HealthOmics和英偉達醫(yī)療保健團隊還合作推出生成式AI微服務,以推進藥物發(fā)現(xiàn)、醫(yī)療技術和數(shù)字健康領域的發(fā)展,該服務提供一個新的GPU加速的云端服務目錄,涵蓋生物學、化學、成像和醫(yī)療保健數(shù)據(jù),以便醫(yī)療企業(yè)能夠在亞馬遜云科技上利用生成式AI的最新成果。

整體而言,這次的合作,是雙方在技術領域的又一次強強聯(lián)合:英偉達的超強算力芯片系統(tǒng)與亞馬遜云科技強大的Elastic Fabric Adapte (EFA)網(wǎng)絡連接能力、高級虛擬化( Amazon Nitro System)和超大規(guī)模集群(Amazon EC2 UltraClusters)等領先技術的結合,使得客戶能夠更快、更大規(guī)模、更低成本且更安全地在云上構建和運行數(shù)萬億參數(shù)的大語言模型。(丁科技網(wǎng)原創(chuàng),轉載務必注明“來源:丁科技網(wǎng)”)

最新文章
1
CES觀察:電視“新百年”,海信開啟RGB-Mini LED時代
2
TCL實業(yè)CES 2025:屏顯科技引領,全品類智能終端展現(xiàn)頂尖科技力
3
亮相2025CES 海信“AI+智慧城市”大步走上世界舞臺
4
杜比在 CES 2025 上展現(xiàn)車載娛樂創(chuàng)新加速度
5
BOE(京東方)前沿技術亮相CES 2025 “HERO”計劃描繪多場景智慧新藍圖
6
蘋果iOS 18.2.1正式版發(fā)布,但新機銷量大幅下滑引熱議
7
碳化硅產業(yè)年終盤點:擴產潮涌,高歌前行
8
工信部:“點、鏈、網(wǎng)、面”體系化推進算力網(wǎng)絡工作
9
未來可期,預測新的2025年家電行業(yè)的發(fā)展趨勢和關鍵詞
10
性價比爆棚!蘋果iPhone SE 4確認4月前發(fā)布:A18+自研5G基帶
11
石頭科技閃耀CES2025 首創(chuàng)仿生機械手掃拖機器人
12
聯(lián)發(fā)科攜手意騰科技,于CES 2025展出多元AI語音方案
13
普及全大核架構!天璣8400-Ultra助力REDMI Turbo 4打造越級游戲體驗
14
2025年到了,家電“送裝一體”服務更好地實現(xiàn)了嗎?
15
2024智能手機行業(yè)十大事件:爭AI、搶高端、玩“捆綁”
16
索尼參展CES 2025,以技術創(chuàng)新踐行 “創(chuàng)意娛樂愿景”,與創(chuàng)作者共創(chuàng)感動
17
海信發(fā)布全球首臺116英寸RGB-Mini LED電視,色彩表現(xiàn)超越QD-OLED
18
12連冠!海爾智家再獲全球智慧家庭發(fā)明專利榜NO.1
19
觀察:AI眼鏡會不會“一地雞毛”?
20
2025中國家電市場十大關鍵詞
關于我們

微信掃一掃,加關注

商務合作
  • QQ:61149512