大模型已基本解決幻覺問題?
今日,百度創(chuàng)始人李彥宏公開表示,“大模型基本消除了幻覺”,這對于大語言模型來說是一個巨大的進(jìn)步
2024-11-13 09:19:36
來源:通信世界全媒體 孫天??

通信世界網(wǎng)消息(CWW)你是否經(jīng)歷過大語言模型一本正經(jīng)“胡說八道”?大模型在發(fā)展初期的幻覺問題尤為嚴(yán)重,所回答問題基本屬于“已讀亂回”,至于哪家企業(yè)的大模型不在本文探討之列,大家心知肚明,更重要的是大語言模型的幻覺問題有了最新進(jìn)展。

今日,百度創(chuàng)始人李彥宏公開表示,“大模型基本消除了幻覺”,這對于大語言模型來說是一個巨大的進(jìn)步,過去一年來大模型的幻覺問題為用戶造成了很多困擾,筆者在參加某次業(yè)內(nèi)會議時,有專家明確指出:“我們期望大模型即使不回答也不要輸出誤導(dǎo)性的錯誤答案?!?/p>

面對大語言模型的幻覺問題,各企業(yè)也在全力攻克,尤其頭部的一些大模型開發(fā)廠商。OpenAl CEO Sam Altman曾指出:“我們正在努力解決幻覺問題,這將需要一年半到兩年的時間?!?/p>

然而,信息技術(shù)行業(yè)發(fā)展到今天,已經(jīng)步入到“日日新”的階段,大型語言模型發(fā)展短短兩年時間,就已在該領(lǐng)域上取得了巨大突破。

那么,為什么LLM會出現(xiàn)幻覺?360創(chuàng)始人周鴻祎曾一針見血地指出:“目前人工智能存在一個全世界公認(rèn)的難題——它會產(chǎn)生幻覺,這是大模型本身固有的特性。”也就是說,幻覺問題是大語言模型與生俱來的。

此外,產(chǎn)生幻覺的原因可大致分為三個方面:數(shù)據(jù)源、訓(xùn)練過程、推理。

具體來看,大語言模型產(chǎn)生幻覺的原因包括數(shù)據(jù)質(zhì)量、算法、專業(yè)領(lǐng)域知識豐富度、是否擬合等。

從數(shù)據(jù)質(zhì)量上來看,大規(guī)模數(shù)據(jù)集中可能存在數(shù)據(jù)質(zhì)量問題,例如缺失值、異常值或不一致性,這些問題可能會導(dǎo)致大文本模型輸出錯誤結(jié)果。

從算法選擇來看,目前大模型已經(jīng)遍地開花,各家大模型選擇的算法各不相同,不同的算法對于大規(guī)模數(shù)據(jù)的處理方式各不相同,選擇不恰當(dāng)?shù)乃惴赡軐?dǎo)致對數(shù)據(jù)的錯誤建模,從而產(chǎn)生幻覺。

從專業(yè)領(lǐng)域的知識的豐富程度來看,大語言模型在涉及某些專業(yè)領(lǐng)域時,會因為知識儲備(語料)不充足或者不能理解專業(yè)領(lǐng)域的數(shù)據(jù),產(chǎn)生對客觀事實的錯誤解讀。

從大語言模型訓(xùn)練的角度來看,存在過擬合的問題。模型在訓(xùn)練數(shù)據(jù)上表現(xiàn)良好,但是對樣本外的數(shù)據(jù)進(jìn)行測試時表現(xiàn)效果不佳,欠擬合和過擬合的大模型出現(xiàn)幻覺的概率一般較高。

雖然大語言模型幻覺一度困擾開發(fā)者和用戶,但有人卻持有不同的觀點——大模型幻覺是非常寶貴的特性,之所以有這樣的觀點,是他們認(rèn)為因為“幻覺和創(chuàng)新其實只有一線之隔”,未來,如何破除幻覺和創(chuàng)新的壁壘將是大模型努力的方向。

其實大語言模型發(fā)展到今天,面臨的不止“幻覺”這一個挑戰(zhàn),如未來隨著數(shù)據(jù)量的巨增,必須要進(jìn)行模型壓縮與優(yōu)化;多模態(tài)模型與大語言模型的結(jié)合,將自然語言處理與計算機(jī)視覺、語音處理等多模態(tài)信息相結(jié)合,擴(kuò)大應(yīng)用場景。

最新文章
1
MediaTek舉辦天璣開發(fā)者大會MDDC 2025,聯(lián)合產(chǎn)業(yè)伙伴加速智能體AI體驗普及和發(fā)展
2
空調(diào)旺季即將啟動 經(jīng)銷商卻困于多重壓力
3
復(fù)旦團(tuán)隊:近三年內(nèi)二維半導(dǎo)體可能“破局”落地
4
超薄直邊設(shè)計,F(xiàn)ind X8s開啟2025手感標(biāo)桿
5
對等關(guān)稅下中國TV出口新格局:新興市場崛起與產(chǎn)業(yè)鏈重構(gòu)
6
亦幻亦真,AI規(guī)模商業(yè)化如何破局?
7
擴(kuò)大內(nèi)循環(huán),2025年以舊換新“國補”帶動家電銷售1247.4億元
8
3.4K掌上巨幕!TCL華星獨供OPPO Pad 4 Pro屏幕
9
天璣9400+發(fā)布:超大核加速110MHz、藍(lán)牙/北斗重磅升級
10
AI+空調(diào)就是給空調(diào)裝上個智能音箱?海信和長虹要整點不一樣的
11
出口受阻,家電行業(yè)應(yīng)守住基本盤同時尋求突破
12
多家家電企業(yè)發(fā)布回購、增持計劃,真金白銀穩(wěn)市
13
海外市場貢獻(xiàn)超50%!石頭科技2024增收不增利,凈利率滑坡敲警鐘
14
特朗普暫停90天執(zhí)行新關(guān)稅:蘋果股價大漲
15
179元 小米Type-C十合一擴(kuò)展塢發(fā)布:USB 3.0、100W快充
16
三星Galaxy S25 Edge發(fā)售計劃推遲,或?qū)⒂?月底首發(fā)中韓市場
17
iPhone要漲價?國產(chǎn)手機(jī)呢?
18
2025空調(diào)市場:美的格力爭“第一”,小米TCL海信忙“增長”
19
美的海爾聯(lián)袂回購:家電雙雄以真金白銀錨定價值中樞
20
攜手京東方,長虹Q10Air帶來了一塊怎樣的“好屏”?
關(guān)于我們

微信掃一掃,加關(guān)注

商務(wù)合作
  • QQ:61149512