當前位置：首頁 > 元宇宙 > AI

LeCun 團隊開源首款代碼世界模型，能像程序員一樣思考的 LLM 來了

來源：責編：時間：2025-09-26 17:37:53 409觀看

導讀瘋狂挖人的 Meta，終于在今天發布了最新 AI 研發成果！代碼世界模型 CWM 是本次發布的模型，創新性地將世界模型引入了代碼生成任務中。這是否會成為編程模型新范式？瘋狂挖人的 Meta，終于把他們的 AI 研發新成果端上

瘋狂挖人的 Meta，終于在今天發布了最新 AI 研發成果！代碼世界模型 CWM 是本次發布的模型，創新性地將世界模型引入了代碼生成任務中。這是否會成為編程模型新范式？

瘋狂挖人的 Meta，終于把他們的 AI 研發新成果端上來了！

就在今天，Meta 官宣發布了一款名為代碼世界模型（Code World Model，CWM）的 LLM，探索如何使用世界模型改進 AI 代碼生成性能。

Yann LeCun 也親自下場轉發撐場子了。

CWM 究竟有哪些創新點？這個 32B 的參數相對較小的大模型，究竟有多強？

CWM 創新點

本次發布的 CWM，最大的創新點是，將世界模型引入了代碼生成任務中。

簡言之，該模型的核心正如 Yann LeCun 所言：生成代碼時，通過提前預測即將生成的代碼指令可能產生的效果，來更好地規劃出能夠滿足人類期望達成的效果的代碼，從而改進生成代碼的質量。

當人類進行規劃時，我們會設想不同行動可能產生的結果。

當人類思考代碼時，會在腦海中模擬其部分執行過程。

而目前市面上的主流語言模型，還很難做到這一點。

專門訓練一個代碼世界模型，補足這一點，生成代碼的效果會不會好很多，是 Meta 要通過本次發布的 CWM 驗證的猜想。

CWM 基于大量編程數據，加上專門定制的 Python 和 Bash（Linux 和 macOS 的命令行解釋器腳本語言）的世界建模數據，進行該模型的訓練。

通過這種訓練，CWM 能夠模擬 Python 程序在 Bash 環境中的執行及與 Agent 之間的交互。

對于「數數 strawberry 中有多少個 r」這個難倒無數大模型的問題，CWM 也用類似 pdb（Python Debug 用的調試器）的形式演示了其工作流程：

CWM 直接發布了 3 個不同的 Checkpoint，用于不同目的。

CWM 性能測試

「光說不練假把式」，我們直接看看這個 32B 的小參數大模型在各類編程基準測試中的表現如何。

SWE-bench Verified 是一個真實開源項目修復的最常用的編程評測標準，讓模型在真實的大型開源倉庫里，根據 GitHub issue+failing tests，定位并修復缺陷，最終以自動化測試是否全部通過來判定是否解決。

在該項測試中，32B 小參數的 CWM 成績為 65.8%，遜于 Qwen3-Coder 和 Kimi-K2-Instruct，與閉源的 Gemini-2.5-Thinking 接近，屬于開源陣營第一梯隊了。

其他測試成績 Alexandr Wang 也直接發出來了：

LiveCodeBench：68.6%

Math-500：96.6%

AIME 2024：76.0%

CWM 模型算是 Meta 的一次概念驗證，投入了不算多的算力訓練這個小參數大模型，主要是為了檢驗將世界模型引入代碼生成任務是否會顯著提高生成代碼質量。

換言之，我們今日看到的這個模型只能算 Demo。大的還在后面？

參考資料：

https://ai.meta.com/research/publications/cwm-an-open-weights-llm-for-research-on-code-generation-with-world-models/

https://x.com/syhw/status/1970960837721653409

https://x.com/AIatMeta/status/1970963571753222319

https://x.com/ylecun/status/1970967341052854748

https://x.com/alexandr_wang/status/1970973317227225433

本文來自微信公眾號：新智元（ID：AI_era）

本文鏈接：http://www.rrqrq.com/showinfo-45-28123-0.htmlLeCun 團隊開源首款代碼世界模型，能像程序員一樣思考的 LLM 來了

聲明：本網頁內容旨在傳播知識，若有侵權等問題請及時與本網聯系，我們將在第一時間刪除處理。郵件：2376512515@qq.com

上一篇： Google DeepMind新突破：機器人可聯網搜索，智能化水平再上新臺階

下一篇： OpenAI 最強 AI 智能體曝光：基于 GPT-5，輕松駕馭寫作、編程、生圖等任務

標簽：

熱門焦點

虛擬人再升級，企業可以解放雙手了？

來源：伯虎財經今天想跟大家來嘮嘮AI，其實聊到這個話題很多人都不陌生了。在ChatGPT和AIGC大熱背后，還有一位低調的“大佬”——虛擬人。比如咱們熟知的虛
超跑與NFT的首次結合，蘭博基尼能否破局？

蘭博基尼公司近日稱即將推出它的首款NFT，并且將加速進軍區塊鏈領域。這家聞名遐邇的意大利汽車廠商野心勃勃地將目光投向混合動力和電動跑車，并宣布將拍賣與瑞士
中國區塊鏈產業生態地圖報告（2021）

區塊鏈是技術整合創新、金融創新、組織方式創新、產業應用創新的多維度創新，以服務實體經濟、政務民生以及公共服務等領域為落腳點，以期實現整個地區和產業的資
上海虹口成立10億元元宇宙基金，香港首只元宇宙ETF擬上市

區塊鏈日報17日訊今日《元宇宙新鮮事》有：上海虹口將成立總額約10億元的元宇宙產業基金；香港市場首只元宇宙主題ETF擬于2月21日上市；元宇宙平臺Roblox出現違禁游
全面擁抱“虛擬世界”，摩登天空要打造“音樂元宇宙”

作者：袁佳琦沈黎暉不怎么打游戲，但許多事兒在他眼里都“有意思”。好玩，有意思，是他的口頭禪，在接受娛樂獨角獸的采訪過程中，他多次提到，做虛擬音樂人，“是件挺好玩的
Meta正在研發元宇宙語音助手；廣東省462家企業申請元宇宙商標

今日《元宇宙新鮮事》有：扎克伯格透露正在為元宇宙研發語音助手；完美世界聲明稱不會以“元宇宙投資項目”等名義吸收資金。廣東省申請元宇宙商標的企業達462家位
Kitten Coup社區反轉Cool Kittens NFT騙局

當狂熱的加密愛好者將金錢投入到NFT圖片時，渾水摸魚的騙局隨之而來，Cool Kittens NFT便是其中一個作惡者，該項目于去年11月在Sonala鏈上啟動小貓形象的NFT鑄造及
Shiba Inu布局元宇宙走出Meme局限

以「狗狗幣殺手」成名的Shiba Inu（SHIB）在人們的印象中始終有著濃厚的Meme（模因惡搞）烙印，但它似乎一直在嘗試突破這種局限。建立起一個龐大的粉絲社區后，Shiba Inu
NFT世界的藝術家名單

我們匯編了以下藝術家的名單，它包括每個藝術家的簡短概述。當然，這份名單肯定不全面，還有很多很多藝術家、哲學家和商業領袖為世界貢獻了不可估量的價值。而他們

国产精品嫩草99av在线_一区在线视频观看_欧美高清一区_欧美日韩国产一区_99精品欧美一区二区三区_久久大香伊蕉在人线观看热2_一色屋精品视频在线观看网站_在线亚洲国产精品网站_亚洲区一区二区三区_你懂的视频一区二区

首頁

元宇宙

NFT

區塊鏈

虛擬人

AR/VR

AI

元宇宙百科

LeCun 團隊開源首款代碼世界模型，能像程序員一樣思考的 LLM 來了

虛擬人再升級，企業可以解放雙手了？

超跑與NFT的首次結合，蘭博基尼能否破局？

中國區塊鏈產業生態地圖報告（2021）

上海虹口成立10億元元宇宙基金，香港首只元宇宙ETF擬上市

全面擁抱“虛擬世界”，摩登天空要打造“音樂元宇宙”

Meta正在研發元宇宙語音助手；廣東省462家企業申請元宇宙商標

Kitten Coup社區反轉Cool Kittens NFT騙局

Shiba Inu布局元宇宙走出Meme局限

NFT世界的藝術家名單

最新推薦

【量子位】虛擬數字人深度產業報告 | 元宇宙Meta洞見

傳騰訊已推出全新XR業務；摩托羅拉正打造5GXR頸戴式計算組件

城市數字孿生標準化白皮書（2022版）

8個最適合藝術家發行NFT的交易市場

影響元宇宙土地價格的五個因素

NFT：新騙局的狩獵場

猜你喜歡

熱門推薦

相關資訊