最新AI:無需被告知規(guī)則就能自己玩轉(zhuǎn)游戲?
2016年,Alphabet的DeepMind與AlphaGo一起問世,該AI一直領(lǐng)先于人類最好的棋手。一年后,工作繼續(xù)完善,AlphaGo Zero創(chuàng)建。AlphaGo通過觀察業(yè)余比賽和專業(yè)比賽學會了圍棋,而AlphaGo Zero能通過簡單地與自己對戰(zhàn)來掌握游戲。然后,DeepMind創(chuàng)建了AlphaZero,該AlphaZero可以使用單一算法玩圍棋、國際象棋和將棋。這些AI的共同特點是,它
原創(chuàng)
2020-12-25 08:00:24
來源:釘科技??

2016年,Alphabet的DeepMind與AlphaGo一起問世,該AI一直領(lǐng)先于人類最好的棋手。一年后,工作繼續(xù)完善,AlphaGo Zero創(chuàng)建。AlphaGo通過觀察業(yè)余比賽和專業(yè)比賽學會了圍棋,而AlphaGo Zero能通過簡單地與自己對戰(zhàn)來掌握游戲。然后,DeepMind創(chuàng)建了AlphaZero,該AlphaZero可以使用單一算法玩圍棋、國際象棋和將棋。

image.png

這些AI的共同特點是,它們必須掌握游戲規(guī)則然后再進行培訓。DeepMind的最新AI MuZero不需要游戲的規(guī)則即可掌握游戲。與DeepMind之前的AI算法一樣,MuZero具有相同甚至更好的能力。  

MuZero沒有嘗試對所有模型進行建模,而只是嘗試考慮那些對決策至關(guān)重要的因素。正如DeepMind所指出的,這是作為人類所做的事情。當大多數(shù)人看著窗外,看到地平線上形成烏云時,他們通常不會陷入烏云是如何形成之類的問題。相反,它們思考的是如果出門應(yīng)該穿什么以防止被淋濕。MuZero就是做類似這樣的事情。

MuZero在做決定時會考慮三件事。首先,它會考慮上一次行動的結(jié)果、當前所處的位置以及下一次行動的最佳方案。這種看似簡單的方法使MuZero成為迄今為止DeepMind最有效的算法。在測試中DeepMind發(fā)現(xiàn),MuZero與之前的AI算法表現(xiàn)都一樣好。而且,給它的時間越多,它提供的解決方案就越好。即使加入了時間限制,比如在行動前限制吃豆人女士的模擬次數(shù),MuZero也取得了不錯的效果。

該公司表示,MuZero的學習能力有一天可以幫助解決沒有簡單規(guī)則領(lǐng)域的復(fù)雜問題。(釘科技根據(jù)《engadget》消息編譯)

最新文章
1
業(yè)界唯一!科大訊飛發(fā)布首個基于全國產(chǎn)算力的深度推理大模型X1
2
斥資134億收購LGD工廠,TCL科技押注LCD市場勝算幾何?
3
12月中國電視整機出貨量378.5萬臺,同比增長9.7%
4
京東方拿下美國專利榜全球第12!顯示領(lǐng)域唯一中企
5
今起買電動自行車有重大變化:出廠鎖死25km/h 無法改裝
6
BBA全球銷量下滑:奧迪跌幅最大 唏噓
7
蘋果想做但沒做出來!OPPO Watch X2全球首發(fā)高血壓風險評估功能
8
CES觀察:空調(diào)新年出海第一站,“中國風”如何席卷全球?
9
我國新能源汽車產(chǎn)銷連續(xù)十年位居全球第一
10
英偉達:拜登政府監(jiān)管政策將削弱美國的全球競爭力
11
中國電信完成業(yè)界首個無線AI新型調(diào)度技術(shù)現(xiàn)網(wǎng)試驗
12
2025剛開年 家電行業(yè)產(chǎn)能再擴張
13
電視開機率斷崖式下跌,是什么讓人們不在看電視呢?
14
OPPO Find N5居然比鉛筆都要薄,“全球最薄折疊旗艦”官宣二月見!
15
消息稱藍廠大折疊手機vivo X Fold 4 Pro延期至Q3發(fā)布
16
余承東:華為手機在供應(yīng)嚴重短缺下 重回中國市場第一
17
空調(diào)2025迎重大利好,這三個品牌值得重點關(guān)注
18
頭部品牌海外集體發(fā)新,投影成2025家電出海生力軍?
19
中國科技殺瘋了!海信首創(chuàng)RGB-Mini LED電視斬獲CES多項大獎
20
CES 2025觀察:海信空調(diào)的新風,繼續(xù)吹向AI風口
關(guān)于我們

微信掃一掃,加關(guān)注

商務(wù)合作
  • QQ:61149512