(資料圖)
認(rèn)為人工智能對人類構(gòu)成威脅的人們可能不喜歡DeepMind的最新成就。Alphabet的AI部門提出了一種新算法,該算法允許機(jī)器在不知道游戲方式的情況下?lián)魯∮螒颉_@是一個絕對令人驚訝的發(fā)展,因為該算法將使AI適應(yīng)尚未被喂食任何特定算法的現(xiàn)實情況。這就是為什么它聽起來也很恐怖的原因。
在學(xué)會游戲后,DeepMind AI擊敗專業(yè)圍棋玩家(AlphaGo)是一回事。但是Deepmind開發(fā)了AlphaGo Zero,它使計算機(jī)可以通過自己玩游戲來掌握游戲。它的前身是通過觀察人與人之間的真實比賽來做到這一點的。Engadget回憶說,AlphaZero緊隨其后。這是一種使用單一算法玩圍棋,象棋和將棋的AI。這些AI創(chuàng)作中的每一個都知道他們正在玩的游戲規(guī)則。
MuZero是最新的DeepMind AI,不需要教這些規(guī)則。它可以自己學(xué)習(xí),做出相應(yīng)計劃并獲勝。MuZero在Atari游戲中可以做同樣的事情。在學(xué)習(xí)規(guī)則之后,新的AI可以變得與以前的版本一樣好,甚至更好。
該項目的目標(biāo)是提供一種單一算法,該算法可使AI在不知道控制該場景的規(guī)則的情況下思考其下一步行動。對于象棋和圍棋這樣的游戲而言,這說起來容易做起來難,因為象棋和圍棋這類預(yù)先定義的動作會讓您成敗。但是在大多數(shù)現(xiàn)實情況下,如果不訪問本質(zhì)上允許其思考的復(fù)雜算法,則AI可能難以導(dǎo)航。
MuZero實際上并沒有為自己思考,這不是科幻小說中令人恐懼的AI。但是,如果DeepMind的算法允許計算機(jī)為未知的所有規(guī)則提供模擬的勝出解決方案,那么它確實達(dá)到了一個重要的里程碑。游戲僅是為了證明算法有效,但它可能會在不受固定規(guī)則約束的現(xiàn)實生活中使用。
Engadget解釋說,MuZero在做出決定時會考慮三件事。首先,它將查看上一步的結(jié)果,它所處的當(dāng)前位置以及下一步的最佳操作方法。DeepMind發(fā)現(xiàn)MuZero與以前的AI匹配。而且,時間越長,交付的解決方案就越好。即使增加了時間限制,例如限制舉動前吃豆人的模擬次數(shù),MuZero也取得了不錯的結(jié)果。
字母表將在哪里使用MuZero尚待觀察。DeepMind認(rèn)為,機(jī)器人技術(shù)可能是一個潛在領(lǐng)域。
標(biāo)簽: