鋅財經的作者陳伊婷在一篇文章中介紹了DeepMind推出的新泛用型游戲XLand。這項新技術意味著我們可以創建一個全新且媲美AlphaGo的人工智能,而無需事先了解游戲規則。長期以來,AI強化學習存在著泛化能力差的問題,只能從頭開始學習一個個單獨的任務。DeepMind先前推出的AlphaZero在圍棋、西洋棋和將棋領域表現出色,但要成為不同游戲中的強者,需要在每個游戲中重新訓練。然而,XLand的出現填補了這個缺陷。它具有高度泛化的能力,類似于人類學會用筷子夾米飯后,也能用筷子夾住其他食物。DeepMind創建XLand的目的是讓通過強化學習訓練的AI能夠玩遍「全宇宙的游戲」。XLand由任務、世界和玩家構成,任務的復雜度由競爭性、平衡性、可選項和探索難度四個維度評判。AI智能體通過第一人稱視角感知游戲環境,并試錯地探索游戲規則,從中積累大量數據來訓練自己完成游戲目標。通過多代訓練,AI在XLand的4000個獨立世界中玩了約70萬個獨立游戲,涉及340萬個獨立任務,最后一代的每個智能體經歷了2000億次訓練步驟。目前,AI智能體已經能夠成功參與幾乎所有評估任務,除了一些連人類也無法完成的任務。DeepMind展示了無監督式機器學習的巨大潛力,并向世界證明未來訓練AI的成本和門檻將會越來越低,直至全球普及。未來,當AI能夠在「
元宇宙」中自主學習演化時,賽博朋克的世界是否會成為現實呢?
熱點:元宇宙