通信世界網消息(CWW)當前,DeepSeek掀起的“模型熱”還在持續(xù)升溫。
正如通信世界全媒體年初所預測的,2025年大模型乃至智能體將迎來進一步繁榮,行業(yè)大模型將深度融入核心業(yè)務與應用、AI終端以及智能體將加速落地。具體到如何實現(xiàn),DeepSeek仿佛一陣“及時雨”,憑借低成本、高效能以及廣泛的應用場景,為行業(yè)實踐提供了良好的技術支撐與應用基礎。
可喜之余,對于渴望在未來大模型領域闖出一片天的企業(yè)來說,結合自身的業(yè)務需求與數(shù)據(jù)特點,在充分發(fā)揮DeepSeek優(yōu)勢之上,“卷”出更具有獨特競爭力的自研大模型乃至智能體,似乎更值得深思。
前期“卷”接入
實現(xiàn)“共進共生”
最直觀來看,目前DeepSeek掀起的“模型熱”主要表現(xiàn)為DeepSeek的“接入熱”。
其中既包括英偉達、亞馬遜以及微軟等國外科技巨頭,也包括極具市場潛力的中國本土企業(yè),從底層的軟硬件設計研發(fā)企業(yè)到互聯(lián)網大廠、運營商、垂直領域AI公司再到中小型初創(chuàng)企業(yè),選擇DeepSeek似乎已成為當下算力成本飆升與商業(yè)化路徑尚未明晰的必然抉擇。
自DeepSeek開放API以來,其生態(tài)版圖快速擴張。據(jù)不完全統(tǒng)計,目前全球已有超過200家企業(yè)宣布接入DeepSeek。就目前來看,接入方式主要分為三類:一是API直接調用,即企業(yè)直接調用DeepSeek的云端API,快速集成其通用能力,如文本生成、代碼編寫等。二是模型微調,即企業(yè)基于DeepSeek基座模型,注入私有數(shù)據(jù)進行領域適配,從而實現(xiàn)自身模型優(yōu)化。三是開源共建,這主要體現(xiàn)在底層架構與設計層面,企業(yè)針對DeepSeek開放的部分模型權重,借助社區(qū)協(xié)作進行自身優(yōu)化。
總體來看,接入是方式,優(yōu)化是目的。隨著企業(yè)對接入方式的逐漸深入,我們可以發(fā)現(xiàn),企業(yè)自研模型與DeepSeek的接入部署,逐漸呈現(xiàn)出全面化、智能化、差異化的特點,兩者結合的模式也逐漸呈現(xiàn)“共生進化”特征。
針對功能補充類,調用API逐漸深入到應用場景接入,例如三大運營商在云能力率先接入的基礎上,已逐漸拓展至to B端、to C端的特色場景與產品服務;多家車企探索將DeepSeek接入智能座艙,實現(xiàn)語音助手功能升級、AI多語義指令識別等。
針對模型部署開發(fā)類,私有化部署與產品成為保障安全的選擇,多家企業(yè)如中國電信、聯(lián)想、新華三、浪潮等均推出了DeepSeek智算一體機,實現(xiàn)一體化開箱即用的私有化部署。與此同時,DeepSeek模型私有化部署服務也涵蓋安裝部署、系統(tǒng)調優(yōu)和運行維護,可提供適配多種算力的部署包及支持,幫助企業(yè)在自有業(yè)務場景中構建安全可靠的智能環(huán)境。
針對技術融合類,單向的知識蒸餾訓練,即單純接入DeepSeek,可提煉其模型能力至自研模型,降低自身部署成本;多向的模型聯(lián)合訓練,即企業(yè)自研大模型與DeepSeek大模型進行深度聯(lián)合訓練,可以促進聯(lián)合創(chuàng)新,為企業(yè)帶來更廣闊的發(fā)展空間。
中期“卷”經驗
挖掘價值站穩(wěn)市場
接入與優(yōu)化滿足當前初步部署應用的需求,但也不可否認,DeepSeek的崛起為自研通用大模型以及行業(yè)大模型帶來了沖擊。
在技術競爭方面,DeepSeek的低成本訓練模式和高效推理能力是其優(yōu)勢所在,也為自研大模型帶來了新的技術競爭壓力。就拿DeepSeek V3來說,其訓練成本僅為557.6萬美元,使用 2048 張 H800 GPU 卡,相比同等規(guī)模的模型(如GPT-4、GPT-4o、Llama 3.1),訓練成本大幅降低。這迫使大模型研發(fā)者不得不重新審視技術路線,加大在降低訓練成本和提升推理效率方面的研發(fā)投入。
在應用場景拓展方面,DeepSeek-R1在科研、數(shù)據(jù)分析、代碼生成等復雜場景表現(xiàn)出色,DeepSeek-V3適合內容創(chuàng)作、長文本生成等場景??陀^來看,這兩類大模型已較為廣泛地覆蓋了當下通用大模型的應用場景,行業(yè)開始出現(xiàn)了新的選擇,即對已入局者以及仍觀望者亮出了新挑戰(zhàn)。
在市場格局重塑方面,DeepSeek的開源和低成本特性,吸引了大量合作伙伴,包括云服務廠商、算力企業(yè)等,改變了通用大模型的市場格局。對于行業(yè)大模型來說,強調其自身價值之前,似乎必須先證明自己模型對行業(yè)專屬數(shù)據(jù)與場景的理解,比直接調教通用模型懂得更多。
基于此,對于企業(yè)自研大模型來說,想要在市場繼續(xù)站穩(wěn)腳跟,正視挑戰(zhàn)與機遇,揚長避短、提升差異化競爭力迫在眉睫。
面向低成本、低算力部署趨勢,大模型行業(yè)應借鑒經驗,與自身結合的基礎上更傾向于研發(fā)和應用能夠在低成本、低算力條件下運行的技術和模型,以降低使用門檻、擴大應用范圍。
面向當下訓練需求逐漸轉向推理需求,充分挖掘數(shù)據(jù)價值有望使部分企業(yè)脫穎而出。對此,企業(yè)應重視數(shù)據(jù)質量的提升,解決數(shù)據(jù)孤島問題,加強數(shù)據(jù)的整合和共享,借助日漸先進的數(shù)據(jù)處理技術和算法,充分挖掘數(shù)據(jù)的價值,為大模型優(yōu)化提供有力支持。
證明自研大模型存在的必要,企業(yè)仍需挖掘自身的差異化優(yōu)勢,結合自身所在行業(yè)的特點和資源,找到獨特的應用場景和價值點,實現(xiàn)差異化競爭。例如,猿輔導的猿力大模型在與DeepSeek融合后找準了教育場景下的個性化學習體驗,通過定制化學習方案,并自動調整學習節(jié)奏,使孩子逐漸找到學習自信。
后期“卷”效用
兼顧效率與商業(yè)化
隨著大模型出現(xiàn)并滲透進日常生活,大模型競爭也進入2.0階段,從長遠來看,大模型已由傳統(tǒng)的技術競賽轉向商業(yè)化效率競爭。
就行業(yè)啟示來看,低成本推理成為剛需。隨著市場競爭的加劇,算力成本曲線已然成為決定市場格局的關鍵因素。數(shù)據(jù)閉環(huán)能力成為新價值。不同于單純追求數(shù)據(jù)量,當下更為數(shù)據(jù)的內容質量以及應用質量。
從效率角度出發(fā),企業(yè)應全方位提升模型的研發(fā)、訓練與應用效率。首先,在研發(fā)環(huán)節(jié),企業(yè)可以嘗試在算法和架構設計下功夫,同時借助自動化代碼生成工具,減少人工編寫代碼的時間和錯誤。其次,在訓練過程中,合理利用分布式計算技術,優(yōu)化訓練算法值得探索。最后,進入應用階段,注重推理效率提升,借助模型壓縮等先進技術與經驗,提高推理速度。
從商業(yè)化角度出發(fā),企業(yè)應精準定位市場需求,制定合理的商業(yè)模式。一方面,企業(yè)可以針對特定行業(yè)的需求,開發(fā)定制化的大模型解決方案。另一方面,企業(yè)可以將大模型作為基礎平臺,開發(fā)一系列的應用產品和服務。
以運營商為例,憑借其自身龐大的用戶數(shù)據(jù)資源,可以充分發(fā)揮自身的網絡和服務優(yōu)勢,優(yōu)化迭代一系列to C端的應用產品和服務。例如:基于自然語言處理大模型優(yōu)化智能客服系統(tǒng)、5G新通話應用以及AI智能助手等,并且根據(jù)用戶的使用習慣和歷史數(shù)據(jù),為用戶提供個性化的服務推薦,從而增強用戶黏性,挖掘存量市場。
總而言之,大模型2.0時代已經來臨,低成本推理、差異化競爭、數(shù)據(jù)價值挖掘以及產業(yè)鏈定位,構成了這個時代大模型企業(yè)發(fā)展的關鍵拼圖。企業(yè)有待將這些要素緊密結合,積極調整戰(zhàn)略,以適應時代的變化,在市場競爭的洪流中穩(wěn)步前行,不斷發(fā)展壯大。
- QQ:61149512