国产精品嫩草99av在线_一区在线视频观看_欧美高清一区_欧美 日韩 国产 一区_99精品欧美一区二区三区_久久大香伊蕉在人线观看热2_一色屋精品视频在线观看网站_在线亚洲国产精品网站_亚洲区一区二区三区_你懂的视频一区二区

當前位置:首頁 > 元宇宙 > AI

o1 核心作者 MIT 演講:激勵 AI 自我學習,比試圖教會 AI 每一項任務更重要

來源: 責編: 時間:2024-09-24 16:21:10 152觀看
導讀 “o1 發布后,一個新的范式產生了”。其中關鍵,OpenAI 研究科學家、o1 核心貢獻者 Hyung Won Chung,剛剛就此分享了他在 MIT 的一次演講。演講主題為“Don’t teach. Incentivize(不要教,要激勵),核心觀點是:激勵 AI

“o1 發布后,一個新的范式產生了”。oTa28資訊網——每日最新資訊28at.com

其中關鍵,OpenAI 研究科學家、o1 核心貢獻者 Hyung Won Chung,剛剛就此分享了他在 MIT 的一次演講。oTa28資訊網——每日最新資訊28at.com

演講主題為“Don’t teach. Incentivize(不要教,要激勵),核心觀點是:oTa28資訊網——每日最新資訊28at.com

激勵 AI 自我學習比試圖教會 AI 每一項具體任務更重要oTa28資訊網——每日最新資訊28at.com

oTa28資訊網——每日最新資訊28at.com

思維鏈作者 Jason Wei 迅速趕來打 call:oTa28資訊網——每日最新資訊28at.com

Hyung Won 識別新范式并完全放棄任何沉沒成本的能力給我留下了深刻的印象。oTa28資訊網——每日最新資訊28at.com

2022 年底,他意識到了強化學習的力量,并從那時起就一直在宣揚它。oTa28資訊網——每日最新資訊28at.com

oTa28資訊網——每日最新資訊28at.com

在演講中,Hyung Won 還分享了:oTa28資訊網——每日最新資訊28at.com

技術人員過于關注問題解決本身,但更重要的是發現重大問題;oTa28資訊網——每日最新資訊28at.com

硬件進步呈指數級增長,軟件和算法需要跟上;oTa28資訊網——每日最新資訊28at.com

當前存在一個誤區,即人們正在試圖讓 AI 學會像人類一樣思考;oTa28資訊網——每日最新資訊28at.com

“僅僅擴展規模”往往在長期內更有效;oTa28資訊網——每日最新資訊28at.com

……oTa28資訊網——每日最新資訊28at.com

下面奉上演講主要內容。oTa28資訊網——每日最新資訊28at.com

對待 AI:授人以魚不如授人以漁

先簡單介紹下 Hyung Won Chung,從公布的 o1 背后人員名單來看,他屬于推理研究的基礎貢獻者。oTa28資訊網——每日最新資訊28at.com

oTa28資訊網——每日最新資訊28at.com

資料顯示,他是 MIT 博士(方向為可再生能源和能源系統),去年 2 月加入 OpenAI 擔任研究科學家。oTa28資訊網——每日最新資訊28at.com

加入 OpenAI 之前,他在 Google Brain 負責大語言模型的預訓練、指令微調、推理、多語言、訓練基礎設施等。oTa28資訊網——每日最新資訊28at.com

oTa28資訊網——每日最新資訊28at.com

在谷歌工作期間,曾以一作身份,發表了關于模型微調的論文。(思維鏈作者 Jason Wei 同為一作)oTa28資訊網——每日最新資訊28at.com

oTa28資訊網——每日最新資訊28at.com

回到正題。在 MIT 的演講中,他首先提到:oTa28資訊網——每日最新資訊28at.com

通往 AGI 唯一可行的方法是激勵模型,使通用技能出現。oTa28資訊網——每日最新資訊28at.com

在他看來,AI 領域正處于一次范式轉變,即從傳統的直接教授技能轉向激勵模型自我學習和發展通用技能。oTa28資訊網——每日最新資訊28at.com

理由也很直觀,AGI 所包含的技能太多了,無法一一學習。(主打以不變應萬變)oTa28資訊網——每日最新資訊28at.com

oTa28資訊網——每日最新資訊28at.com

具體咋激勵呢??oTa28資訊網——每日最新資訊28at.com

他以下一個 token 預測為例,說明了這種弱激勵結構如何通過大規模多任務學習,鼓勵模型學習解決數萬億個任務的通用技能,而不是單獨解決每個任務。oTa28資訊網——每日最新資訊28at.com

他觀察到:oTa28資訊網——每日最新資訊28at.com

如果嘗試以盡可能少的努力解決數十個任務,那么單獨模式識別每個任務可能是最簡單的;oTa28資訊網——每日最新資訊28at.com

如果嘗試解決數萬億個任務,通過學習通用技能(例如語言、推理等)可能會更容易解決它們。oTa28資訊網——每日最新資訊28at.com

oTa28資訊網——每日最新資訊28at.com

對此他打了個比方,“授人以魚不如授人以漁”,用一種基于激勵的方法來解決任務。oTa28資訊網——每日最新資訊28at.com

Teach him the taste of fish and make him hungry.(教 AI 嘗嘗魚的味道,讓他餓一下)oTa28資訊網——每日最新資訊28at.com

然后 AI 就會自己出去釣魚,在此過程中,AI 將學習其他技能,例如耐心、學習閱讀天氣、了解魚等。oTa28資訊網——每日最新資訊28at.com

其中一些技能是通用的,可以應用于其他任務。oTa28資訊網——每日最新資訊28at.com

面對這一“循循善誘”的過程,也許有人認為還不如直接教來得快。oTa28資訊網——每日最新資訊28at.com

但在 Hyung Won 看來:oTa28資訊網——每日最新資訊28at.com

對于人類來說確實如此,但是對于機器來說,我們可以提供更多的計算來縮短時間。oTa28資訊網——每日最新資訊28at.com

oTa28資訊網——每日最新資訊28at.com

換句話說,面對有限的時間,人類也許還要在專家 or 通才之間做選擇,但對于機器來說,算力就能出奇跡。oTa28資訊網——每日最新資訊28at.com

他又舉例說明,《龍珠》里有一個設定:在特殊訓練場所,角色能在外界感覺只是一天的時間內獲得一年的修煉效果。oTa28資訊網——每日最新資訊28at.com

對于機器來說,這個感知差值要高得多。oTa28資訊網——每日最新資訊28at.com

因此,具有更多計算能力的強大通才通常比專家更擅長特殊領域。oTa28資訊網——每日最新資訊28at.com

原因也眾所周知,大型通用模型能夠通過大規模的訓練和學習,快速適應和掌握新的任務和領域,而不需要從頭開始訓練。oTa28資訊網——每日最新資訊28at.com

oTa28資訊網——每日最新資訊28at.com

他還補充道,數據顯示計算能力大約每 5 年提高 10 倍。oTa28資訊網——每日最新資訊28at.com

oTa28資訊網——每日最新資訊28at.com

總結下來,Hyung Won 認為核心在于:oTa28資訊網——每日最新資訊28at.com

模型的可擴展性oTa28資訊網——每日最新資訊28at.com

算力對加速模型進化至關重要oTa28資訊網——每日最新資訊28at.com

此外,他還認為當前存在一個誤區,即人們正在試圖讓 AI 學會像人類一樣思考。oTa28資訊網——每日最新資訊28at.com

但問題是,我們并不知道自己在神經元層面是如何思考的。oTa28資訊網——每日最新資訊28at.com

機器應該有更多的自主性來選擇如何學習,而不是被限制在人類理解的數學語言和結構中。oTa28資訊網——每日最新資訊28at.com

在他看來,一個系統或算法過于依賴人為設定的規則和結構,那么它可能難以適應新的、未預見的情況或數據。oTa28資訊網——每日最新資訊28at.com

造成的結果就是,面對更大規模或更復雜的問題時,其擴展能力將會受限。oTa28資訊網——每日最新資訊28at.com

oTa28資訊網——每日最新資訊28at.com

回顧 AI 過去 70 年的發展,他總結道:oTa28資訊網——每日最新資訊28at.com

AI 的進步與減少人為結構、增加數據和計算能力息息相關。oTa28資訊網——每日最新資訊28at.com

與此同時,面對當前人們對 scaling Law 的質疑,即認為僅僅擴大計算規模可能被認為不夠科學或有趣。oTa28資訊網——每日最新資訊28at.com

Hyung Won 的看法是:oTa28資訊網——每日最新資訊28at.com

在擴展一個系統或模型的過程中,我們需要找出那些阻礙擴展的假設或限制條件。oTa28資訊網——每日最新資訊28at.com

舉個例子,在機器學習中,一個模型可能在小數據集上表現良好,但是當數據量增加時,模型的性能可能會下降,或者訓練時間會變得不可接受。oTa28資訊網——每日最新資訊28at.com

這時,可能需要改進算法,優化數據處理流程,或者改變模型結構,以適應更大的數據量和更復雜的任務。oTa28資訊網——每日最新資訊28at.com

也就是說,一旦識別出瓶頸,就需要通過創新和改進來替換這些假設,以便模型或系統能夠在更大的規模上有效運行。oTa28資訊網——每日最新資訊28at.com

訓練 VS 推理:效果相似,推理成本卻便宜 1000 億倍

除了上述,o1 另一核心作者 Noam Brown 也分享了一個觀點:oTa28資訊網——每日最新資訊28at.com

訓練和推理對模型性能提升作用相似,但后者成本更低,便宜 1000 億倍。oTa28資訊網——每日最新資訊28at.com

oTa28資訊網——每日最新資訊28at.com

這意味著,在模型開發過程中,訓練階段的資源消耗非常巨大,而實際使用模型進行推理時的成本則相對較低。oTa28資訊網——每日最新資訊28at.com

有人認為這凸顯了未來模型優化的潛力。oTa28資訊網——每日最新資訊28at.com

oTa28資訊網——每日最新資訊28at.com

不過也有人對此持懷疑態度,認為二者壓根沒法拿來對比。oTa28資訊網——每日最新資訊28at.com

這是一個奇怪的比較。一個是邊際成本,另一個是固定成本。這就像說實體店比其中出售的商品貴 500000 倍。oTa28資訊網——每日最新資訊28at.com

oTa28資訊網——每日最新資訊28at.com

對此,你怎么看?oTa28資訊網——每日最新資訊28at.com

Hyung Won Chung 演講 PPT:oTa28資訊網——每日最新資訊28at.com

https://docs.google.com/presentation/d/1nnjXIuN2XDJENAOaKXI5srQscO3276svvP6JgivTv6w/edit#slide=id.g2d1161c9c52_0_20oTa28資訊網——每日最新資訊28at.com

參考鏈接:oTa28資訊網——每日最新資訊28at.com

[1]https://x.com/hwchung27/status/1836842717302943774oTa28資訊網——每日最新資訊28at.com

[2]https://x.com/tsarnick/status/1836215965912289306oTa28資訊網——每日最新資訊28at.com

本文來自微信公眾號:量子位(ID:QbitAI),作者:一水oTa28資訊網——每日最新資訊28at.com

本文鏈接:http://www.rrqrq.com/showinfo-45-7592-0.htmlo1 核心作者 MIT 演講:激勵 AI 自我學習,比試圖教會 AI 每一項任務更重要

聲明:本網頁內容旨在傳播知識,若有侵權等問題請及時與本網聯系,我們將在第一時間刪除處理。郵件:[email protected]

上一篇: 部分科技巨頭請求歐盟對 AI“從寬”監管,避免數十億美元罰款風險

下一篇: Redmi Note 14 Pro+豪配6200mAh大電池,還送電池保?

標簽:
  • 熱門焦點
    SQL Error: select * from ***_ecms_news13 where id in(,54,140,267,44,231,75,156,194) limit 9
Top 国产精品嫩草99av在线_一区在线视频观看_欧美高清一区_欧美 日韩 国产 一区_99精品欧美一区二区三区_久久大香伊蕉在人线观看热2_一色屋精品视频在线观看网站_在线亚洲国产精品网站_亚洲区一区二区三区_你懂的视频一区二区
午夜不卡av在线| 亚洲一区二区在线播放相泽| 一本大道久久a久久综合婷婷| 一区精品在线| 欧美午夜一区| 黄色亚洲精品| 中文精品在线| 国产欧美大片| 久久天堂成人| 欧美体内she精高潮| 欧美探花视频资源| 91精品国产综合久久久久久久久久| 欧美色精品天天在线观看视频| 欧美午夜精品一区二区三区| 欧美性xxxxxxxx| 日韩欧美国产电影| 国产午夜精品一区二区三区四区| 国产人成亚洲第一网站在线播放| 国产视频在线观看一区二区三区| 国产精品免费久久| 一区二区三区在线视频免费 | 亚洲视频小说图片| 亚洲电影视频在线| 日本午夜精品一区二区三区电影| 激情亚洲综合在线| 成人黄色a**站在线观看| 欧美一区二区三区另类 | 精品黑人一区二区三区久久| 久久精品人人做人人综合 | 五月激情六月综合| 高清视频一区二区| 国产综合久久| 91精品办公室少妇高潮对白| 91精品在线观看入口| 久久久精品免费网站| 亚洲在线成人精品| 国产一区二区三区视频在线播放| 91免费看片在线观看| 亚洲一区二区精品在线| 在线成人免费视频| 国产精品欧美一区喷水| 日本人妖一区二区| zzijzzij亚洲日本少妇熟睡| 亚洲精品一二| 在线不卡一区二区| 亚洲久草在线视频| 国产成人在线视频播放| 在线视频国内自拍亚洲视频| 欧美性色黄大片| 欧美激情资源网| 免费观看30秒视频久久| 欧美一区91| 欧美午夜电影网| 国产精品网站一区| 国产麻豆精品在线| 亚洲精选一区| 欧美第一区第二区| 亚洲一区二区不卡免费| 99精品在线免费| 玖玖精品视频| 欧美国产日韩亚洲一区| 精品一区中文字幕| 国产欧美午夜| 欧美激情一区二区三区在线| 久久精品久久精品| 亚洲欧洲一区二区在线观看| 日韩写真欧美这视频| 亚洲va国产va欧美va观看| 欧美在线三级| 欧美亚洲一区二区在线| 亚洲精品乱码久久久久久日本蜜臀| 国产精品自产自拍| 久久久久高清| 综合中文字幕亚洲| 91麻豆免费观看| 欧美日本国产视频| 亚洲www啪成人一区二区麻豆| 91视频国产资源| 欧美午夜精品免费| 亚洲综合区在线| 狠狠爱www人成狠狠爱综合网| 91精品国产一区二区三区| 无码av中文一区二区三区桃花岛| 亚洲小说欧美另类社区| 精品日韩av一区二区| 国产精品亚洲综合一区在线观看| 亚洲免费影视| 一区二区三区影院| 色综合网色综合| 亚洲精品一区二区精华| 国产福利电影一区二区三区| 久久综合九色综合久99| 亚洲一区二区三区美女| 国产日韩免费| 一区二区三区在线观看动漫| 狠狠88综合久久久久综合网| 国产精品视频免费看| 欧美a级片网站| 久久久久久久久久久久久夜| av资源网一区| 国产亚洲一二三区| 91丝袜美腿高跟国产极品老师 | 99热免费精品在线观看| √…a在线天堂一区| 亚洲东热激情| 亚洲综合色婷婷| 久久精品女人的天堂av| 丝袜亚洲另类欧美| 日本精品一级二级| 国内精品写真在线观看| 91精品福利在线一区二区三区| 国产在线播放一区三区四| 678五月天丁香亚洲综合网| 国产乱色国产精品免费视频| 日韩精品中文字幕一区二区三区 | 国产精品影视网| 精品美女一区二区| 欧美成人首页| 亚洲最大色网站| 91国偷自产一区二区三区观看| 卡一卡二国产精品 | 中文字幕久久午夜不卡| 夜夜嗨一区二区三区| 视频一区中文字幕| 欧美一区二区三区视频免费播放 | 69成人精品免费视频| 国产成人小视频| 欧美在线二区| 亚洲va中文字幕| 亚洲成a人v欧美综合天堂下载| 久久精品一区二区三区中文字幕| 久久疯狂做爰流白浆xx| 精品少妇一区二区三区日产乱码 | 亚洲与欧洲av电影| 欧美区在线观看| 欧美午夜电影在线观看 | 亚洲性感美女99在线| 亚洲成年人网站在线观看| 欧美综合亚洲图片综合区| 国产在线精品免费av| 国产亚洲午夜| 蜜臀av性久久久久蜜臀aⅴ流畅| 欧美日韩国产a| 欧美日韩国产综合一区二区 | 国产一区二区三区精品视频| 欧美一区2区三区4区公司二百| 国产欧美一区二区精品婷婷| 亚洲一二三区精品| 一区在线播放视频| 另类亚洲自拍| 国产伦精品一区二区三区免费迷| 国产乱码精品| 精品国产髙清在线看国产毛片| 国产三级三级三级精品8ⅰ区| 777欧美精品| 精品奇米国产一区二区三区| 久久久亚洲午夜电影| 欧美日韩成人一区二区| 欧美成熟视频| 波多野结衣一区二区三区| 91麻豆国产福利精品| 亚洲理论在线观看| 国产精品视频免费看| 欧美人动与zoxxxx乱| 久久先锋影音av| ...av二区三区久久精品| 久久精品成人| 国产成人在线看| 亚洲色图在线播放| 在线观看视频一区二区| 99久久精品免费看国产| 亚洲在线观看免费视频| 欧美日韩激情一区| 国产麻豆日韩欧美久久| 午夜欧美一区二区三区在线播放| 欧美一区二区黄| aa亚洲婷婷| 国产一区 二区 三区一级| 午夜国产精品影院在线观看| 欧美成人激情免费网| 国产精品女主播一区二区三区| 不卡区在线中文字幕| 99精品国产在热久久| 91在线无精精品入口| 色综合天天综合网国产成人综合天 | 亚洲成人一区二区在线观看| 欧美一区二区三区视频免费播放 | 国产精品国产三级国产aⅴ原创| 久久亚洲精品欧美| 国产综合色产| 奇米色一区二区| 亚洲444eee在线观看| 中文字幕制服丝袜一区二区三区| 欧美日韩在线一区二区| 一本色道久久综合亚洲精品高清 | 免费亚洲视频| 国产一区清纯| 91丨九色丨国产丨porny| 亚洲日本久久| 欧美一区二区三区四区五区 |