-->
DeepSeek發(fā)布兩款新模型,推理能力比肩GPT-5
目前,DeepSeek官方網(wǎng)頁端、App和API均已更新為正式版DeepSeek-V3.2。Speciale版本目前僅以臨時API服務(wù)形式開放,以供社區(qū)評測與研究。
2025-12-04 08:40:43
來源:中國電子報、電子信息產(chǎn)業(yè)網(wǎng) 陳存??

12月1日,DeepSeek正式發(fā)布兩款新模型——DeepSeek-V3.2與DeepSeek-V3.2-Speciale,在多項智能體評測中均達(dá)到當(dāng)前開源模型的最高水平,大幅縮小了開源模型與閉源模型的差距。

DeepSeek稱,標(biāo)準(zhǔn)版DeepSeek-V3.2適合日常使用,例如問答和通用智能體任務(wù)場景。在公開的推理類基準(zhǔn)測試中,其性能已達(dá)到GPT-5水平,僅略低于Gemini-3.0-Pro,同時輸出長度顯著縮短,降低了計算開銷與用戶等待時間。

值得注意的是,V3.2并沒有針對這些測試集的工具進(jìn)行特殊訓(xùn)練,這意味著V3.2在真實應(yīng)用場景中能夠展現(xiàn)出較強(qiáng)的泛化性。

不同于過往版本在思考模式下無法調(diào)用工具的局限,DeepSeek-V3.2還是首個將思考融入工具使用的模型,同時支持思考模式與非思考模式的工具調(diào)用。

長思考增強(qiáng)版DeepSeek-V3.2-Speciale進(jìn)一步結(jié)合了DeepSeek-Math-V2的定理證明能力,具備指令跟隨、數(shù)學(xué)證明與邏輯驗證能力,在主流推理基準(zhǔn)測試中的表現(xiàn)可媲美Gemini-3.0-Pro。

據(jù)悉,該模型還成功斬獲IMO 2025(國際數(shù)學(xué)奧林匹克)、CMO 2025(中國數(shù)學(xué)奧林匹克)、ICPC World Finals 2025(國際大學(xué)生程序設(shè)計競賽全球總決賽)及IOI 2025(國際信息學(xué)奧林匹克)金牌。其中,ICPC與IOI成績分別達(dá)到了人類選手第二名與第十名的水平。

目前,DeepSeek官方網(wǎng)頁端、App和API均已更新為正式版DeepSeek-V3.2。Speciale版本目前僅以臨時API服務(wù)形式開放,以供社區(qū)評測與研究。

原創(chuàng)文章
最新文章
1
全球出貨量超1100萬臺,追覓掃地機(jī)以第一增速領(lǐng)跑市場!
2
快手上線“新銀發(fā)力量2.0”,展示不被定義的活力人生
3
這個春耕季,兩個女孩把東北打工日記拍火了
4
當(dāng)AI轉(zhuǎn)場遇上廣西果園,95后退役大學(xué)生在快手重寫鄉(xiāng)土表達(dá)
5
快手電商首場“新衣秀場”啟幕 沉浸式直播間大秀即秀即買
6
當(dāng)房貸、孩子和外債一起壓來,這對90后夫妻在快手重新把生活接住
7
蘋果將在今年晚些時候推出15款以上的新產(chǎn)品
8
亞馬遜收購Globalstar:聯(lián)手蘋果,狙擊Starlink
9
一季度空調(diào)全渠道零售額同比下滑13.8%,行業(yè)聚焦節(jié)能舒適
10
空調(diào)行業(yè)的維度隔離,技術(shù)、價格與市場的三重分化
11
ColorOS 16正式版來了!鎖屏島、AI閃記重磅上線
12
蘋果史上第一次!iPhone 18 Pro可變光圈致動器量產(chǎn)
13
2999元起!大疆Pocket 4上線后秒售罄:首批消費(fèi)者直言期待已久
14
影音雙擎賦能千行百業(yè),海信商用顯示重磅亮相北京 InfoComm 2026
15
“新智綠”家電走熱廣交會,誰扛起了這面大旗?
16
裁判級畫質(zhì)硬核護(hù)航!海信RGB-Mini LED電視賦能2026世界杯精準(zhǔn)判罰
17
家電財報里的AI:光環(huán)下的“溫差”
18
2026年唯一帶3.5mm耳機(jī)孔的高端旗艦!索尼Xperia 1 VIII來了
19
小米18 Pro屏幕史詩級加強(qiáng):極窄四等邊+定制基材 史上最強(qiáng)
20
蘋果官微緊急提醒:iPhone用戶盡快更新iOS,防范高危網(wǎng)頁攻擊
關(guān)于我們

微信掃一掃,加關(guān)注

商務(wù)合作
  • QQ:61149512