国产精品嫩草99av在线_一区在线视频观看_欧美高清一区_欧美 日韩 国产 一区_99精品欧美一区二区三区_久久大香伊蕉在人线观看热2_一色屋精品视频在线观看网站_在线亚洲国产精品网站_亚洲区一区二区三区_你懂的视频一区二区

當前位置:首頁 > 元宇宙 > AI

谷歌 DeepMind 閉關修煉《我的世界》:自學成才挖鉆石,成果登 Nature

來源: 責編: 時間:2025-04-05 09:27:11 143觀看
導讀 AI 又進化了,在沒有任何人類數據的參與下,自己玩《我的世界》還能找到鉆石!在剛剛登上 Nature 的論文中,谷歌 DeepMind 的智能體通過純?自我學習,順利完成了收集鉆石的任務。論文鏈接:https://www.nature.com/arti

AI 又進化了,在沒有任何人類數據的參與下,自己玩《我的世界》還能找到鉆石!Cnw28資訊網——每日最新資訊28at.com

在剛剛登上 Nature 的論文中,谷歌 DeepMind 的智能體通過純?自我學習,順利完成了收集鉆石的任務。Cnw28資訊網——每日最新資訊28at.com

Cnw28資訊網——每日最新資訊28at.com

論文鏈接:https://www.nature.com/articles/s41586-025-08744-2Cnw28資訊網——每日最新資訊28at.com

對此,DeepMind 的計算機科學家 Danijar Hafner 表示:「Dreamer 是一個重要的里程碑,標志著 AI 又朝著通用人工智能前進了一大步。」Cnw28資訊網——每日最新資訊28at.com

又是 AI 和《我的世界》,為何這次就成了邁向 AGI 的一大步

用 AI 來挑戰《我的世界》早已是 AI 界「喜聞樂見」的項目了。Cnw28資訊網——每日最新資訊28at.com

作為世界上排名第一且月活超過 1 億的游戲,《我的世界》可以說是涵蓋了幾乎所有年齡段的人群。Cnw28資訊網——每日最新資訊28at.com

早在兩三年前,包括 OpenAI 在內的各個模型都有挑戰《我的世界》的嘗試。Cnw28資訊網——每日最新資訊28at.com

Cnw28資訊網——每日最新資訊28at.com

更早在 2019 年,研究人員就認為《我的世界》的開放式游戲環境可能非常適合 AI 研究。Cnw28資訊網——每日最新資訊28at.com

比如一個七歲的小孩在觀看了 10 分鐘演示視頻后就能學會如何在游戲中找到稀有的鉆石,而當年的 AI 還遠遠做不到這一點。Cnw28資訊網——每日最新資訊28at.com

Cnw28資訊網——每日最新資訊28at.com

AI 從《我的世界》中的一個隨機位置開始,必須完成某些任務來找到鉆石Cnw28資訊網——每日最新資訊28at.com

為何這次 DeepMind 就敢說是「通向 AGI 的一大步」呢?Cnw28資訊網——每日最新資訊28at.com

這次的任務 —— 在游戲內尋找鉆石 —— 聽起來容易,但其實非常困難,「高玩」們也要花 20-30 分鐘才能找到一個鉆石。Cnw28資訊網——每日最新資訊28at.com

Cnw28資訊網——每日最新資訊28at.com

給不熟悉游戲的朋友解釋下這個任務為什么這么困難:Cnw28資訊網——每日最新資訊28at.com

1. 每一次的游戲場景都是隨機世界,包含各種地形的虛擬 3D 世界,包括森林、山脈、沙漠和沼澤,這讓 AI 無法只記住一種特定策略來作弊;Cnw28資訊網——每日最新資訊28at.com

2. 想要獲得鉆石需要經過一系列復雜的前置流程,并不是隨機在地圖尋找,比如你需要:Cnw28資訊網——每日最新資訊28at.com

先找到樹木Cnw28資訊網——每日最新資訊28at.com

然后將樹木分解為木材,木材也僅僅是用來制作一個工作臺Cnw28資訊網——每日最新資訊28at.com

有了工作臺再加上更多的木材你才可以制作一個木頭鎬頭Cnw28資訊網——每日最新資訊28at.com

然后才能開始挖掘以尋找鉆石Cnw28資訊網——每日最新資訊28at.com

......Cnw28資訊網——每日最新資訊28at.com

鉆石恒久遠,AI 不疲倦

AI 研究人員專注于在《我的世界》中尋找鉆石,Hafner 說因為這需要一系列復雜的步驟,是一個很長的里程碑鏈條,因此它需要非常深入的探索。Cnw28資訊網——每日最新資訊28at.com

Cnw28資訊網——每日最新資訊28at.com

▲DeepMind 的 Dreamer AI 在《我的世界》中進行了多次游戲學習如何收集鉆石

之前的嘗試讓 AI 系統收集鉆石依賴于使用人類游戲的視頻或研究人員引導系統完成各個步驟。Cnw28資訊網——每日最新資訊28at.com

相比之下,Dreamer 通過強化學習的試錯技術自行探索游戲的所有內容 —— 它識別出可能帶來獎勵的動作,重復這些動作并放棄其他動作。Cnw28資訊網——每日最新資訊28at.com

強化學習是一些重大 AI 進展的基礎,但之前的程序都是專家型的 —— 它們無法從零開始在新領域應用知識。Cnw28資訊網——每日最新資訊28at.com

成功的關鍵是構建「世界模型」

Dreamer 成功的關鍵在于它構建了周圍環境的模型,并使用這個世界模型來「想象」未來的情景并指導決策。Cnw28資訊網——每日最新資訊28at.com

Cnw28資訊網——每日最新資訊28at.com

就像我們自己的抽象思維一樣,世界模型并不是周圍環境的精確復制品。Cnw28資訊網——每日最新資訊28at.com

世界模型允許 Dreamer 嘗試不同的事情,「世界模型真正賦予了人工智能系統想象未來的能力」Hafner 說。Cnw28資訊網——每日最新資訊28at.com

這種能力還可能有助于創造能夠在現實世界中學習互動的機器人 —— 在現實世界中,試錯的成本要比在視頻游戲中高得多。Cnw28資訊網——每日最新資訊28at.com

研究團隊一開始并不是奔著「鉆石測試」去研究的,測試 Dreamer 在鉆石挑戰上的表現是一個事后的想法。Cnw28資訊網——每日最新資訊28at.com

「在構建整個算法時并沒有考慮到這一點」,Hafner 說,但團隊意識到,這是測試其算法是否能夠開箱即用、處理不熟悉任務的理想方式。Cnw28資訊網——每日最新資訊28at.com

在《我的世界》中,團隊使用了一種協議,每當 Dreamer 完成鉆石收集過程中涉及的 12 個逐步步驟之一時,就會獲得一個「+1」的獎勵 —— 這些步驟包括制作木板和熔爐、開采鐵礦并鍛造鐵鎬。Cnw28資訊網——每日最新資訊28at.com

這些中間獎勵促使 Dreamer 選擇了更有可能獲得鉆石的動作。團隊每 30 分鐘重置一次游戲,這樣 Dreamer 就不會適應某個特定的配置 —— 而是學會了獲得更多獎勵的一般規則。Cnw28資訊網——每日最新資訊28at.com

在這種設置下,Dreamer 需要連續玩大約九天才能找到至少一顆鉆石。Cnw28資訊網——每日最新資訊28at.com

而高手玩家找到一顆鉆石需要 20 到 30 分鐘,新手則需要更長的時間。Cnw28資訊網——每日最新資訊28at.com

在 Minecraft 中進行鉆石挑戰

游戲中的每一次都設定在一個獨特的隨機生成且無限的三維世界中。Cnw28資訊網——每日最新資訊28at.com

每一次持續到玩家死亡或達到 36,000 步(相當于 30 分鐘),根據 MineRL 競賽提供的動作形成了一個分類動作空間,其中包括抽象的制作動作。Cnw28資訊網——每日最新資訊28at.com

Cnw28資訊網——每日最新資訊28at.com

據 DeepMind 宣稱,Dreamer 是第一個在不使用人類數據的情況下從零開始在《我的世界》中收集鉆石的算法。Cnw28資訊網——每日最新資訊28at.com

所有的 Dreamer 智能體都在一億次步驟內發現了鉆石。所有物品的成功率顯示在圖右擴展數據中。Cnw28資訊網——每日最新資訊28at.com

盡管其他幾個強大的算法(例子中的 PPO、Rainbow 和 IMPALA)進展到了諸如鐵鎬等高級物品,但沒有一個發現鉆石。Cnw28資訊網——每日最新資訊28at.com

Dreamer 算法核心原理

Dreamer 算法的核心是學習一個世界模型。Cnw28資訊網——每日最新資訊28at.com

這就像是智能體的大腦,讓智能體具備豐富的感知能力,通過想象未來場景來規劃行動。Cnw28資訊網——每日最新資訊28at.com

算法由三個關鍵的神經網絡組成:世界模型、評論家網絡和行動者網絡。Cnw28資訊網——每日最新資訊28at.com

世界模型通過自動編碼學習感官輸入的表示,并通過預測潛在動作的未來表示和獎勵來實現規劃。Cnw28資訊網——每日最新資訊28at.com

將世界模型實現為遞歸狀態空間模型,如圖所示。Cnw28資訊網——每日最新資訊28at.com

Cnw28資訊網——每日最新資訊28at.com

評論家網絡則對世界模型預測的每個結果進行價值判斷,評估這個結果對實現目標的幫助有多大。Cnw28資訊網——每日最新資訊28at.com

行動者網絡根據評論家的判斷,選擇能達到最佳結果的行動。Cnw28資訊網——每日最新資訊28at.com

這三個網絡相互協作,在智能體與環境交互的過程中,通過重放經驗同時進行訓練。Cnw28資訊網——每日最新資訊28at.com

在訓練過程中,世界模型的學習至關重要。它要學習從感官輸入中提取有用信息,還要預測未來的狀態和獎勵。Cnw28資訊網——每日最新資訊28at.com

為實現這一目標,世界模型需要最小化預測損失、動態損失和表示損失。Cnw28資訊網——每日最新資訊28at.com

Cnw28資訊網——每日最新資訊28at.com

預測損失用于訓練解碼器和獎勵預測器,動態損失訓練序列模型預測下一個表示,表示損失則讓表示更具可預測性。Cnw28資訊網——每日最新資訊28at.com

圖中可視化了世界模型的長期視頻預測。Cnw28資訊網——每日最新資訊28at.com

Cnw28資訊網——每日最新資訊28at.com

實驗結果

DeepMind 團隊在 8 個領域的 150 多個任務中評估 Dreamer 算法的通用性,包括連續和離散動作、視覺和低維輸入、密集和稀疏獎勵、不同的獎勵尺度、二維和三維世界以及程序生成。Cnw28資訊網——每日最新資訊28at.com

Cnw28資訊網——每日最新資訊28at.com

圖中展示了基準測試結果,Dreamer 在所有測試中均有更好的表現。Cnw28資訊網——每日最新資訊28at.com

Cnw28資訊網——每日最新資訊28at.com

在 Atari 基準測試中,它能在使用少量計算資源的情況下,超越 MuZero 算法,也優于 Rainbow 和 IQN 算法。Cnw28資訊網——每日最新資訊28at.com

在 ProcGen 基準測試中,面對隨機生成的關卡和視覺干擾,Dreamer 算法在 5000 萬幀的預算內,超過了經過調優的 PPG 和 Rainbow 算法。Cnw28資訊網——每日最新資訊28at.com

在 DMLab 基準測試里,它在 1 億幀訓練后,性能超過了 IMPALA 和 R2D2 + 智能體,數據效率大幅提升。Cnw28資訊網——每日最新資訊28at.com

在 Atari100k 基準測試中,盡管訓練預算僅為 40 萬幀,Dreamer 算法依然能超越其他方法。Cnw28資訊網——每日最新資訊28at.com

在 BSuite 基準測試中,它同樣表現出色,在尺度穩健性方面有很大改進。Cnw28資訊網——每日最新資訊28at.com

研究人員進行了消融實驗,結果表明,所有的穩健性技術都有助于提高算法性能。Cnw28資訊網——每日最新資訊28at.com

Cnw28資訊網——每日最新資訊28at.com

研究人員還對 Dreamer 算法的縮放屬性進行了研究。Cnw28資訊網——每日最新資訊28at.com

他們訓練了不同規模的模型,參數從 12M 到 4M。結果發現,擴大模型規模不僅能提高任務性能,還能減少數據需求。Cnw28資訊網——每日最新資訊28at.com

更多的梯度步數也能減少學習成功行為所需的交互次數。這表明 Dreamer 算法在計算資源增加時,能夠穩健地提升性能,為實際應用提供了更靈活的選擇。Cnw28資訊網——每日最新資訊28at.com

這篇論文是關于訓練一個單一算法,期望其能在多樣化的強化學習任務中表現出色。Cnw28資訊網——每日最新資訊28at.com

在《我的游戲》中尋找鉆石也許僅僅通向 AGI 之路的第一關。Cnw28資訊網——每日最新資訊28at.com

AI 的下一個更大目標是《我的世界》玩家面臨的終極挑戰:擊殺末影龍,這個虛擬世界中最可怕的生物。Cnw28資訊網——每日最新資訊28at.com

Cnw28資訊網——每日最新資訊28at.com

參考資料:Cnw28資訊網——每日最新資訊28at.com

https://www.nature.com/articles/d41586-025-01019-w#ref-CR1Cnw28資訊網——每日最新資訊28at.com

https://www.nature.com/articles/s41586-025-08744-2Cnw28資訊網——每日最新資訊28at.com

https://x.com/danijarh/status/1907511182598222095Cnw28資訊網——每日最新資訊28at.com

本文來自微信公眾號:新智元(ID:AI_era),原標題《DeepMind 閉關修煉「我的世界」,自學成才挖鉆登 Nature!人類玩家瑟瑟發抖》Cnw28資訊網——每日最新資訊28at.com

本文鏈接:http://www.rrqrq.com/showinfo-45-11930-0.html谷歌 DeepMind 閉關修煉《我的世界》:自學成才挖鉆石,成果登 Nature

聲明:本網頁內容旨在傳播知識,若有侵權等問題請及時與本網聯系,我們將在第一時間刪除處理。郵件:[email protected]

上一篇: 百度飛槳框架 3.0 正式版發布,五大特性專為大模型設計

下一篇: 谷歌 AI 筆記應用 NotebookLM 新增“發現資料”功能,可自動檢索相關網絡資源

標簽:
  • 熱門焦點
Top 国产精品嫩草99av在线_一区在线视频观看_欧美高清一区_欧美 日韩 国产 一区_99精品欧美一区二区三区_久久大香伊蕉在人线观看热2_一色屋精品视频在线观看网站_在线亚洲国产精品网站_亚洲区一区二区三区_你懂的视频一区二区
国产精品久久久久7777按摩| 91美女在线看| 亚洲一二区在线| 91精品国产综合久久蜜臀| 五月天一区二区| 亚洲第一在线综合在线| 久久视频一区二区| 国产美女av一区二区三区| 亚洲欧美成人| 亚洲情趣在线观看| 国内精品福利| 欧美激情一区三区| 91视频一区二区三区| 日韩一区二区三区在线| 黑人巨大精品欧美黑白配亚洲| 久久国产精品免费一区| 亚洲男人的天堂网| 国产三区精品| 天堂精品中文字幕在线| 久久久久看片| 免费在线观看一区| 欧美变态tickling挠脚心| 国产一区二三区| 欧美成人女星排行榜| 国产精品中文欧美| 国产欧美日韩不卡| 亚洲伦理一区| 天堂在线亚洲视频| 91精品国产综合久久蜜臀| 成人不卡免费av| 国产精品久久久久久久第一福利| 黄页网站一区| 天天亚洲美女在线视频| 欧美亚洲动漫精品| 91美女在线观看| 亚洲成a人v欧美综合天堂 | 久久久久高清精品| 国产亚洲一区在线播放| 免播放器亚洲一区| 中文字幕成人网| 噜噜噜91成人网| 欧美日韩视频| 日韩黄色小视频| 2024国产精品| 久久综合精品一区| 国产不卡高清在线观看视频| 国产精品久久精品日日| 91成人国产精品| 国模吧视频一区| 免费成人在线网站| 一区在线观看免费| 欧美一区二区三区人| 亚洲黄色视屏| 高清shemale亚洲人妖| 一区二区欧美精品| 2024国产精品视频| 4438x亚洲最大成人网| 日韩视频在线播放 | 国产成人免费视频精品含羞草妖精 | 欧美一区二区大片| 国产精品毛片| 欧美日韩岛国| av一区二区久久| 国产九色精品成人porny| 免费观看一级欧美片| 亚洲免费毛片网站| 国产精品毛片大码女人| 精品福利av导航| 精品少妇一区二区三区日产乱码| 葵司免费一区二区三区四区五区| 亚洲高清久久| 亚洲二区精品| 在线观看福利一区| 狠狠久久婷婷| 中文亚洲字幕| 国产精品久久777777毛茸茸| 欧美日韩亚洲一区| 黄页网站一区| 亚洲制服少妇| 在线视频一区二区三区| 香蕉免费一区二区三区在线观看| 亚洲巨乳在线| 色美美综合视频| 欧美人牲a欧美精品| 精品粉嫩aⅴ一区二区三区四区| 久久精品人人做人人爽人人| 久久精品视频在线看| 中文字幕在线一区免费| 亚洲精品免费电影| 青青草原综合久久大伊人精品| 毛片一区二区三区| 成人精品国产福利| 一本久道综合久久精品| 亚洲综合日本| 日韩欧美成人午夜| 国产精品久久免费看| 日韩理论片一区二区| 久久国产精品色| 五月天一区二区三区| 欧美日韩国语| 日韩一区二区三区视频在线观看| 中文字幕亚洲一区二区va在线| 国产黄色精品网站| 国产精品一页| 国产精品美女久久久久久| 免费一级片91| 国产精品日韩欧美一区二区| 欧美一区二区三区性视频| 亚洲综合在线观看视频| 99精品欧美一区| 91精品麻豆日日躁夜夜躁| 亚洲夂夂婷婷色拍ww47| 播五月开心婷婷综合| 久久综合一区| 午夜私人影院久久久久| 欧美日韩中文| 国产视频一区不卡| 成人综合在线观看| 91精品婷婷国产综合久久性色| 亚洲电影欧美电影有声小说| 欧美成人高清| 国产精品网友自拍| 在线观看的日韩av| 中文字幕日韩av资源站| 国产精品v欧美精品∨日韩| 国产亚洲一区二区三区四区| 成人国产免费视频| 日韩免费电影网站| 成人午夜碰碰视频| 日韩欧美在线不卡| 国产.精品.日韩.另类.中文.在线.播放| 国产一区日韩二区欧美三区| 香蕉久久夜色精品国产| 日本中文字幕一区二区视频| 久久综合九九| 国产黑丝在线一区二区三区| 91精品国产91久久综合桃花| 国产黄人亚洲片| 国产精品美女久久久久aⅴ国产馆 国产精品美女久久久久av爽李琼 国产精品美女久久久久高潮 | 国产亚洲一二三区| 国产精品久久久久久久免费软件 | 成人美女在线观看| 欧美人成网站| 欧美一级理论片| 国产高清在线精品| 欧美视频一区| 久久亚洲综合| 成人免费黄色大片| 亚洲午夜久久久久久久久久久| 久久国产精品一区二区三区| 麻豆91精品视频| 国产三区在线成人av| 亚洲国产专区| 免费久久精品视频| 久久久久国产精品麻豆ai换脸| 久久青草国产手机看片福利盒子 | 一本久久精品一区二区| 成人综合日日夜夜| 亚洲女人****多毛耸耸8| 欧美日韩国产精品自在自线| 91麻豆蜜桃一区二区三区| 一区二区三区在线播| 欧美久久久久久久久久| 欧美日韩在线精品| 麻豆成人在线观看| 成人欧美一区二区三区黑人麻豆| 欧美在线小视频| 激情视频一区| 成人性色生活片免费看爆迷你毛片| 亚洲欧洲av色图| 欧美亚一区二区| 亚洲国产精品123| 99视频超级精品| 久草中文综合在线| 亚洲大片一区二区三区| 国产午夜精品一区二区三区嫩草| 国产精品一区在线播放| 99国产精品99久久久久久| 丝袜脚交一区二区| 国产精品美女久久久久久2018| 欧美高清www午色夜在线视频| 国产一区导航| 欧美日韩精品免费观看| 国产丶欧美丶日本不卡视频| 天天爽夜夜爽夜夜爽精品视频| 91精品国产黑色紧身裤美女| 久久久久.com| 国产精品theporn| 欧美精品二区| 91在线国产观看| 成人午夜大片免费观看| 精品亚洲国内自在自线福利| 首页欧美精品中文字幕| 亚洲一区二区黄色| 一区二区三区日本| 一区二区三区在线视频观看58 | 国产深夜精品| 日本高清不卡在线观看| 欧美性videosxxxxx| 91福利资源站|