-->
OpenAI發(fā)布的GPT-4o究竟“?!痹谀膬??
今天實現(xiàn)這一突破的還是OpenAI??梢哉f,在大模型混戰(zhàn)日益激烈的今天,OpenAI釋放了又一重磅炸彈——GPT-4o。
2024-05-17 09:32:25
來源:天極網(wǎng)??

【天極網(wǎng)企業(yè)頻道】先是GPT的持續(xù)迭代,后是文生視頻的Sora的一騎絕塵,一直被OpenAI牽著鼻子走的大模型在經(jīng)歷繁花似錦的一年之后,終于在行業(yè)化場景化嘗試落地,并于多模態(tài)能力尋求新的突破。?

GPT-4o橫空出世

而今天實現(xiàn)這一突破的還是OpenAI??梢哉f,在大模型混戰(zhàn)日益激烈的今天,OpenAI釋放了又一重磅炸彈——GPT-4o。

事情是這樣的。今天凌晨,OpenAI在其春季發(fā)布會上推出最新杰作GPT-4o,以其突破性的智能交互能力,徹底顛覆了我們對AI語音助手的認(rèn)知。

在一段簡短的視頻中,OpenAI揭曉了其新一代AI大模型GPT-4o,該模型能夠?qū)崟r進(jìn)行音頻、視覺和文本的推理。GPT-4o中的“o”源自O(shè)mni,即“全能”,體現(xiàn)了其全面而強(qiáng)大的能力。?

何為全能?在發(fā)布現(xiàn)場,OpenAI技術(shù)負(fù)責(zé)人穆拉迪(Mira?Murati)表示:“新型號GPT-4o‘速度快得多’,在文本、視頻和音頻方面都有改進(jìn),公司最終計劃讓用戶與ChatGPT進(jìn)行視頻聊天。這是我們第一次在易用性方面邁出巨大的一步?!?/p>

據(jù)透露,相較于先前的GPT-4?Turbo,GPT-4o在運(yùn)算速度和成本效益方面均實現(xiàn)了顯著的優(yōu)化。

更為出色的是,GPT-4o擁有對文本、圖像、音頻等多種信息模態(tài)的處理能力,從而為用戶提供了更為自然且流暢的交互體驗。

更快更強(qiáng)還免費

OpenAI不僅發(fā)布全新旗艦大模型GPT-4o,還更新界面以提高用戶使用體驗,并且宣布免費開放使用,付費用戶享有五倍的使用容量限制。

在免費使用方面,官方給出的免費限制在一定消息數(shù)量上,超過這個消息量之后,免費的模型將被切回ChatGPT。這是GPT-4o的優(yōu)勢之一。

在API使用上,GPT-4o相較于去年11月發(fā)布的GPT-4-turbo,價格降低了50%,速度提升了200%,進(jìn)一步提升了性價比。

更令人期待的是,未來幾周內(nèi),GPT-4o的語音和視頻輸入功能也將陸續(xù)推出,為用戶帶來更多元的交互方式。?

與現(xiàn)有的大模型相比,GPT-4o在音頻與視覺方面表現(xiàn)得尤為出色。其中,在音頻方面,GPT-4o可以在短至232毫秒的時間內(nèi)響應(yīng)用戶的語音輸入,這也意味著320毫秒的用時已經(jīng)接近人類在日常對話中的反應(yīng)時間。

而在GPT-4o之前,用戶使用Voice?Mode(由三個獨立模型組成)與ChatGPT通話,但平均延遲為2.8秒(GPT-3.5)和5.4秒(GPT-4)。這也進(jìn)一步證明了GPT-4o的先進(jìn)之處。

同時,GPT-4o能夠應(yīng)對文本、音頻和圖像任意組合的多元化輸入,并據(jù)此生成相應(yīng)類型的任意組合輸出。

此外,GPT-4o在英語文本和代碼處理方面的表現(xiàn)與GPT-4?Turbo旗鼓相當(dāng),而在非英語文本的處理能力上,GPT-4o更是展現(xiàn)出了顯著的性能提升。

據(jù)悉,GPT-4o在設(shè)計中內(nèi)置了跨模式的安全性,并創(chuàng)建了新的安全系統(tǒng),為語音輸出提供護(hù)欄。

此外,GPT-4o還與來自社會心理學(xué)、偏見和公平、錯誤信息等領(lǐng)域的70多名外部專家開展廣泛的外部團(tuán)隊合作,以識別新增加的模式引入或放大的風(fēng)險,提高與GPT-4o互動的安全性。

不停歇的OpenAI

從GPT到Sora再到GPT-4o,可以說,OpenAI在大模型創(chuàng)新的路上持續(xù)前行,并在大模型領(lǐng)域一騎絕塵。

早在上周便有消息傳出,OpenAI準(zhǔn)備推出一款A(yù)I搜索引擎,并將矛頭指向Google即將召開的I/O大會。然而,AI搜索引擎并未如期而至,到來的是GPT-4o。?

GPT-4o不僅能通過聲音和文字跟人交流,還能識別物體和圖像,并且邏輯推理能力也比現(xiàn)在市面上的產(chǎn)品要強(qiáng)。

可以說,GPT-4o將轉(zhuǎn)錄音頻和文本轉(zhuǎn)語音等功能合二為一,構(gòu)建一個更懂圖像和音頻的多模態(tài)模型,響應(yīng)速度也更快。

在筆者看來,無論是上個月推出的“語音引擎”(Voice?Engine),還是更早些時候發(fā)布的?TTS(文本轉(zhuǎn)語音)軟件,都有著不俗的表現(xiàn),有著更為廣泛的應(yīng)用場景,且實用性更強(qiáng)。

以微軟為例,微軟也在考慮用技術(shù)來提升語音助手,OpenAI表示,這次更新“是朝著實用性的方向發(fā)展?!?/p>

除了探索更為實用的場景外,OpenAI也將推出新的定價模式,調(diào)查數(shù)據(jù)顯示,一直“燒錢”的OpenAI今年預(yù)計將迎來數(shù)十億美元的收入。

據(jù)悉,假如客戶通過預(yù)付費預(yù)定Tokens,便能享受高達(dá)50%。一些AI服務(wù)器經(jīng)銷商曾表示,在他們的軟件上運(yùn)行開源模型比使用OpenAI的模型便宜六倍。

毫無疑問,這種更靈活的定價,將有助于OpenAI更好地與其他模型開發(fā)人員和AI服務(wù)器經(jīng)銷商競爭。

尋求場景化落地與商業(yè)化是OpenAI解決燒錢焦慮的重要方法,通過發(fā)布GPT-4o,我們看到OpenAI的決心與實力。

寫在最后

在競爭激烈的大模型市場,OpenAI接連發(fā)布重磅版本,一騎絕塵。

不管我們承認(rèn)與否,在GPT-4o的發(fā)布下,大模型的多模態(tài)交互的能力再次被拉高,OpenAI仍然站在多模態(tài)的最高峰。

接下來,讓我們期待大模型領(lǐng)域其他玩家的新發(fā)布。

最新文章
1
2026電視市場:存儲芯片漲價抑制銷量TOP5或有品牌被“擠出”
2
家電進(jìn)入存量時代,企業(yè)需把握技術(shù)創(chuàng)新創(chuàng)造更高溢價
3
iPhone 18 Pro或取消靈動島:傳將采用單孔屏與屏下Face ID方案
4
全球首款2nm手機(jī)芯片登場!三星Exynos 2600 10核3.9GHz性能刷新紀(jì)錄
5
馬斯克放話:xAI三年內(nèi)擊敗競爭對手 明年實現(xiàn)通用人工智能
6
漲價函滿天飛,家電卻“漲不動”?
7
最強(qiáng)編程模型!OpenAI發(fā)布GPT-5.2-Codex
8
2999元起 vivo S50正式開售:性能、設(shè)計等八大升級
9
激活內(nèi)需煥新動力,紅頂獎與行業(yè)攜手共創(chuàng)不凡
10
漢印“超激鼓”激光打印機(jī)發(fā)布!為政采提供高可靠低成本新選擇
11
斬獲電視行業(yè)唯一紅頂獎 海信RGB-Mini LED樹立高端市場新標(biāo)桿
12
莫一林:數(shù)據(jù)與商業(yè)雙輪驅(qū)動,具身智能將突破“不可能三角”
13
榮耀Magic8 Mini要來了!6.3英寸小直屏+天璣9500
14
華為全新MatePad 11.5宣布12月22日發(fā)布 類自然光顯示 更護(hù)眼
15
業(yè)界首款!豪威單芯片LCOS小尺寸面板發(fā)布 采用3微米像素
16
“前輩”iRobot破產(chǎn),給中國掃地機(jī)企業(yè)“四點啟示”
17
告別“大馬拉小車”!海爾4Hz超低頻中央空調(diào),重新定義家居舒適節(jié)能新標(biāo)準(zhǔn)
18
聚勢小說劇,創(chuàng)享新流量,快手小程序行業(yè)沙龍引領(lǐng)內(nèi)容變革
19
商品卡環(huán)比增長60%,快手商品卡川流計劃助力德佑解鎖貨架場增量
20
古穿今開啟雙向救贖,快手星芒短劇《偽裝游戲》詮釋熱血青春友誼
關(guān)于我們

微信掃一掃,加關(guān)注

商務(wù)合作
  • QQ:61149512