通信世界網(wǎng)消息(CWW)在最近的展會上,小編聽到了很多行業(yè)大佬在講“AI Agent”。
一般附在大模型的后面,介紹的篇幅甚至要比大模型更長更詳細(xì)。
那么,備受推崇的AI Agent究竟是什么,與目前的大模型有什么區(qū)別呢?
按百度百科來講,AI Agent是一種能夠感知環(huán)境、進(jìn)行決策和執(zhí)行動作的智能實(shí)體。不同于傳統(tǒng)的人工智能,AI Agent 具備通過獨(dú)立思考、調(diào)用工具去逐步完成給定目標(biāo)的能力。
意思就是,相比于大模型,AI Agent“會使用工具”。
如果說人與動物的區(qū)別是人類會使用工具,那么AI Agent與大模型的區(qū)別亦然。
因?yàn)楫?dāng)前的LLM(大語言模型),無論是國外的ChatGPT還是國內(nèi)的文心一言、Kimi智能助手等,都是對話式,都是按照用戶提問-回答-再提問-再回答(如此循環(huán))來實(shí)現(xiàn)。
那么,問題就來了,這些大模型輸出的內(nèi)容常取決于用戶的提問能力,如果提問不夠精確、不夠全面,是不是就得不到滿意的效果?
因此,現(xiàn)在網(wǎng)上甚至出現(xiàn)一些“大模型提示詞怎么寫?”“AI大模型或重塑職場!'會提問'將成制勝新技能”等言論。
就連我們編輯部的設(shè)計(jì)師同事也曾吐槽過,雖然大模型出一張圖很快,但如何讓它設(shè)計(jì)出滿意的圖,卻比自己完成花的時(shí)間更久。
由此可見,當(dāng)前人工智能方面的重要矛盾是人們對大模型日益增長的需要與大模型提問模式不平衡不充分的發(fā)展之間的矛盾。?
而且,隨著AI的不斷迭代,如今很多算法已經(jīng)實(shí)現(xiàn)了自主學(xué)習(xí)、調(diào)用工具的能力,因此,AI Agent應(yīng)運(yùn)而生。
AI Agent的起源、定義
在查閱Agent的論文時(shí),我發(fā)現(xiàn)其中很大一部分是關(guān)于哲學(xué)方面的表述。
甚至最早要追溯到”道生一,一生二,二 生三,三生萬物”可以自我演進(jìn)的春秋時(shí)期(公元前450年)和“擁有欲望、信念、意圖和采取行動能力的實(shí)體”的亞里士多德時(shí)期(公元前350年)。
足以見得,人類對于人工智能甚至說演進(jìn)的研究保持了一如既往的熱愛。
而當(dāng)代Agent的起源,則莫過于圖靈測試。20 世紀(jì) 50 年代,阿蘭圖靈(Alan Turing)把“高度智能有機(jī)體”概念擴(kuò)展到了人工實(shí)體,并提出了著名的圖靈測試。即測試者寫下自己的問題,隨后將問題以純文本的形式(如計(jì)算機(jī)屏幕和鍵盤)發(fā)送給另一個(gè)房間中的一個(gè)人與一臺機(jī)器。測試者根據(jù)他們的回答來判斷哪一個(gè)是真人,哪一個(gè)是機(jī)器。
隨著人工智能的發(fā)展,如今的“高度智能有機(jī)體”逐漸得到共識:用來描述顯示智能行為并具有自主性、反應(yīng)性、主動性和社 交能力等素質(zhì)的實(shí)體——AI Agent。
同時(shí),自圖靈測試后,人工智能經(jīng)歷了上世紀(jì)60年代電影等文藝作品的涌現(xiàn)、1997年深藍(lán)擊敗人類國際象棋冠軍、2011年蘋果發(fā)布Siri、2012年AlexNet 卷積神經(jīng)網(wǎng)絡(luò)的深度學(xué)習(xí)模型取得“ImageNet 計(jì)算機(jī)視覺挑戰(zhàn)賽”第一名、2016年AlphaGO擊敗世界圍棋冠軍李在石等光輝時(shí)刻。
終于在2022年末,隨著ChatGPT發(fā)布5天,用戶數(shù)突破100萬人,人工智能憑借大模型再一次肩負(fù)起了能給世界帶來革命性改變的重托。
緊接著,在2023年4月,OpenAI發(fā)布了AutoGPT。
與ChatGPT不同的是,用戶不需要不斷對 AI 提問以獲得對應(yīng)回答,在 AutoGPT 中只需為其提供一個(gè) AI 名稱、描述和五個(gè)目標(biāo),AutoGPT 就可以自己完成項(xiàng)目。它可以讀寫文件、瀏覽網(wǎng)頁、審查自己提示的結(jié)果,以及將其與所說的提示歷史記錄相結(jié)合。
如果說這還沒有讓大家感到重視。那么2023年6 月底,OpenAI Safety 團(tuán)隊(duì)負(fù)責(zé)人翁麗蓮在自己的博客上發(fā)表的一篇名為 LLM Powered Autonomous Agents 的文章足以讓大家對Agent有了更多了解。文中,翁麗蓮詳細(xì)介紹了基于LLM的AI Agent,并直言:AI Agent將是使LLM轉(zhuǎn)為通用問題解決方案的途徑之一。
一時(shí)間,AI Agent成為繼LLM之后的又一熱門話題,如今提及AI Agent,創(chuàng)業(yè)者們就會雙眼放光,投資人們也是熱情高漲,大企業(yè)們更是躍躍欲試。
在2024世界互聯(lián)網(wǎng)大會上,中國工程院院士鄔賀銓就曾言,AI Agent是大模型落地載體的關(guān)鍵作用。他認(rèn)為,國內(nèi)外科技巨頭紛紛布局智能體領(lǐng)域,搭建各自的智能體開發(fā)平臺,以推動AI技術(shù)的廣泛應(yīng)用與商業(yè)化進(jìn)程。
同時(shí),在“2024 WAIC”上,百度創(chuàng)始人、董事長兼首席執(zhí)行官李彥宏就也公開表示:“Agent是我們最看好的AI應(yīng)用發(fā)展方向。”
此外,比爾蓋茨、吳恩達(dá)、李飛飛等均多次表示AI Agent是重要發(fā)展方向。
Agent爆發(fā)前夜
大廠都在“卷”什么?
Agent有著如此重要的行業(yè)前景,自然,國內(nèi)外大廠都在精心布局,但從實(shí)際效果來說,究竟是真的具有自主性、獨(dú)立性,還是在原有人工智能的基礎(chǔ)上扣一個(gè)Agent的外殼,走“換湯不換藥”那一套,也具有極強(qiáng)的迷惑性。
國際視角
作為AI領(lǐng)域的先鋒,Open AI不僅早在2023年4月推出推出 Plugin(插件),希望用戶可以輕松在Plugin平臺下開發(fā)應(yīng)用插件,并且在OpenAI首屆開發(fā)者大會(OpenAI DevDay)上,OpenAI發(fā)布了AI Agent初期形態(tài)產(chǎn)品GPTs,推出了相應(yīng)的制作工具GPT Builder。用戶僅僅通過跟GPT Builder聊天,把想要的GPT功能描述一遍,就能生成專屬GPT。
然而,目前OpenAI打造的GPT商店(即GPTs)卻因只能讓ChatGPT Plus 付費(fèi)會員使用,受益面較窄,因此一時(shí)間無法達(dá)成“復(fù)刻App Store輝煌”的目標(biāo)。
微軟在AI Agent的布局上同樣不遺余力。2023年3月Microsoft 365 Copilot發(fā)布,在當(dāng)時(shí)便提出了一種基于LLM的應(yīng)用開發(fā)范式,即Agent。2024年5月22日,微軟在一年一度的Build開發(fā)者大會正式推出Team Copilot,將Copilot for Microsoft 365從幕后的個(gè)人AI助手,擴(kuò)展為團(tuán)隊(duì)助手。
在toB方面,IBM提出基于深厚技術(shù)與客戶基礎(chǔ),實(shí)現(xiàn)Agent和智能體平臺的組合布局,推出企業(yè)級AI與數(shù)據(jù)平臺——watsonx平臺。在7月9日的IBM Think大會上,IBM宣布了watsonx平臺的新更新和新推出的數(shù)據(jù)與自動化功能,稱使人工智能對企業(yè)而言更具開放性、成本效益與靈活性。
國內(nèi)視角
在國內(nèi),AI Agent的發(fā)展同樣如火如荼。2024年,中國“玩家”與時(shí)俱進(jìn),在2024年元年論被“說爛了”的基礎(chǔ)上,提出了“2024年是AI Agent的發(fā)展元年”一說。
不僅大廠中,字節(jié)跳動的扣子、騰訊云的騰訊元器、百度智能云千帆AgentBuilder、阿里云大模型平臺百煉、科大訊飛星火智能體平臺、華為方舟實(shí)驗(yàn)室的盤古智能體框架(Pangu-智能體)等紛紛“出手”,同時(shí)包括智譜AI、面壁智能等大模型創(chuàng)業(yè)公司,容聯(lián)云、思邁特等SaaS公司,釘釘、飛書等協(xié)同辦公賽道企業(yè)等也都在“加碼”。
但該說不說,Agent仍然是國內(nèi)被認(rèn)可的人工智能應(yīng)用落地的最重要的產(chǎn)品形態(tài)。
依照OSI參考模型,有媒體將當(dāng)前中國AI Agent生態(tài)分為算力層(泛AI算力)、平臺框架層(企業(yè)級AI Agent平臺和開發(fā)者AI Agent平臺/框架)和垂直應(yīng)用層三層。
其中,在算力基礎(chǔ)設(shè)施層面,阿里云、百度智能云、華為云等領(lǐng)軍企業(yè)憑借卓越的計(jì)算資源調(diào)配能力與龐大的數(shù)據(jù)存儲容量,構(gòu)筑了AI技術(shù)發(fā)展的堅(jiān)實(shí)基礎(chǔ)。
平臺框架層作為連接底層算力與上層應(yīng)用的“橋梁”,可細(xì)化為兩大核心方向:一是企業(yè)級AI Agent平臺,以釘釘、實(shí)在智能等企業(yè)為代表,通過整合先進(jìn)的人工智能技術(shù)與敏銳的行業(yè)洞察,為企業(yè)用戶打造智能化、自動化的業(yè)務(wù)流程,顯著提升運(yùn)營效率與決策精準(zhǔn)度。二是AI Agent開發(fā)平臺,如星火智能體開發(fā)平臺、文心智能體平臺等,致力于為廣大開發(fā)者提供開放、靈活的開發(fā)環(huán)境。
垂直應(yīng)用層則是AI生態(tài)體系中直接面向終端用戶的“前沿陣地”,涵蓋了金融、招聘、營銷、供應(yīng)鏈、教育、數(shù)據(jù)分析、AI PC等眾多領(lǐng)域。
但從目前來看,由于Agent的重要性,一些大廠甚至在各個(gè)層面都有布局,形成“大廠要生態(tài)、小廠要聚焦”的場景。
結(jié)語
數(shù)據(jù)顯示,全球數(shù)據(jù)量將在未來5年保持持續(xù)增長,2022年,全球數(shù)據(jù)規(guī)模已達(dá)到103ZB,中國數(shù)據(jù)規(guī)模達(dá)到23.9ZB;預(yù)計(jì)2027年,全球數(shù)據(jù)規(guī)??蛇_(dá)到284.3ZB,2022-2027的復(fù)合增長率可達(dá)到22%,而中國數(shù)據(jù)量規(guī)模則可達(dá)到76.6ZB。
在這樣的數(shù)據(jù)規(guī)模下,人工智能的應(yīng)用邊界似乎只受限于人類的想象力,可謂是“只有你想不到,沒有我辦不到”。
但也必須清醒認(rèn)識,AI Agent的演進(jìn)并非旨在取代人類,而是在拓展人類發(fā)展的邊界,為人類社會注入前所未有的可能性。AI將逐步轉(zhuǎn)型為工作中的得力伙伴,以其不知疲倦的探索精神和永恒的好奇心,成為人類智慧的重要補(bǔ)充。
而AI Agent也終將是一位助手,而已。
- QQ:61149512