色爱精品视频一区,亚洲欧美韩国,男女视频在线,久久精品国产精品

歡迎訪問財經股市網
首頁 > 科技 > 正文

“阿爾法狗”進化到第四代,無需告知規(guī)則 MuZero算法自學成“棋”才

科技來源:科技日報2021-01-05 10:55
  

  MuZero成為DeepMind最先進的AI算法。(圖片來源:DeepMind公司網站)

  科技日報記者 馮衛(wèi)東

  據最新一期《自然》雜志報道,DeepMind公司開發(fā)的一種人工智能(AI)算法MuZero,可以在不告知其游戲規(guī)則的情況下掌握圍棋、國際象棋、日本將棋和視頻游戲,這是谷歌人工智能部門獲得的又一重大突破。

  DeepMind公司表示,研究人員多年來一直在尋找一種方法,既可以學習建立用于解釋當前環(huán)境的模型,也能夠利用這個模型來進行最好的決策。到目前為止,大多數方法都難以在Atari這種游戲中進行有效規(guī)劃。

  MuZero最初在2019年推出,通過只關注環(huán)境中最重要的一個方面,來學習建立模型并解決問題。通過將這種方法與“阿爾法狗”強大的搜索樹技術相結合,MuZero的能力實現了重大飛躍。此外,MuZero還利用了前瞻搜索、基于模型的規(guī)劃來解決問題。

  MuZero不會使用規(guī)則來找到最佳情況(因為事先不被告知),而是學習考慮游戲環(huán)境的各個方面,自己觀察它是否重要。在數百萬場比賽中,它不僅學習規(guī)則,而且學習位置的通用價值、成功的通用策略以及事后評估自己行為的方式。后一種功能可幫助其從自身的錯誤中學習、回憶和重做游戲,以嘗試各種不同方法來進一步優(yōu)化位置和策略價值。

  MuZero不僅在國際象棋、圍棋和日本將棋上達到了與提供完善規(guī)則的“阿爾法狗”一樣的超人水平,在Atari游戲這樣的雜亂感知輸入環(huán)境中,也創(chuàng)造了新紀錄。研究人員將MuZero描述為“在追求通用算法方面邁出的重要一步”。

【版權及免責聲明】凡注明"轉載來源"的作品,均轉載自其它媒體,轉載目的在于傳遞更多的信息,并不代表本網贊同其觀點和對其真實性負責。財經股市網倡導尊重與保護知識產權,如發(fā)現本站文章存在內容、版權或其它問題,煩請聯系。 聯系方式:QQ:2261036103,我們將及時溝通與處理。
新聞推薦


主站蜘蛛池模板: 招远市| 雷波县| 永嘉县| 元氏县| 乌兰察布市| 澄江县| 防城港市| 双牌县| 广西| 安图县| 左贡县| 阿拉善左旗| 安溪县| 许昌市| 宝鸡市| 武夷山市| 威远县| 公主岭市| 博湖县| 绥滨县| 江都市| 灵台县| 尉氏县| 铜鼓县| 茌平县| 湘潭县| 鄂托克前旗| 梅河口市| 乡城县| 台东市| 南乐县| 沙洋县| 丰镇市| 获嘉县| 阿图什市| 阿尔山市| 双柏县| 钟祥市| 麻栗坡县| 分宜县| 长春市|