當(dāng)前位置：首頁 > 元宇宙 > AI

METR 實(shí)測(cè)：OpenAI o3 AI 推理模型有“作弊”傾向以提升分?jǐn)?shù)

來源：責(zé)編：時(shí)間：2025-04-21 09:46:03 137觀看

導(dǎo)讀 4 月 18 日消息，風(fēng)險(xiǎn)測(cè)試機(jī)構(gòu)“機(jī)器智能測(cè)試風(fēng)險(xiǎn)”（METR）昨日（4 月 17 日）發(fā)布報(bào)告，與 OpenAI 合作測(cè)試其 o3 模型時(shí)發(fā)現(xiàn)，該模型展現(xiàn)出更強(qiáng)的“作弊”或“黑客行為”傾向，試圖通過操控任務(wù)評(píng)分系統(tǒng)提升成績。援引報(bào)告

4 月 18 日消息，風(fēng)險(xiǎn)測(cè)試機(jī)構(gòu)“機(jī)器智能測(cè)試風(fēng)險(xiǎn)”（METR）昨日（4 月 17 日）發(fā)布報(bào)告，與 OpenAI 合作測(cè)試其 o3 模型時(shí)發(fā)現(xiàn)，該模型展現(xiàn)出更強(qiáng)的“作弊”或“黑客行為”傾向，試圖通過操控任務(wù)評(píng)分系統(tǒng)提升成績。

援引報(bào)告內(nèi)容，在 HCAST（人類校準(zhǔn)自主軟件任務(wù)）和 RE-Bench 測(cè)試套件中，o3 模型約 1% 到 2% 的任務(wù)嘗試涉及此類行為。

這些行為包括對(duì)部分任務(wù)評(píng)分代碼的“精巧利用”。METR 表示，若不將這些作弊嘗試計(jì)為失敗任務(wù)，o3 的“50% 時(shí)間范圍”將延長約 5 分鐘，其 RE-Bench 評(píng)分甚至可能超過人類專家。

METR 還懷疑 o3 可能存在“沙袋行為”（sandbagging），即故意隱藏真實(shí)能力，但其作弊傾向已明顯違背用戶和 OpenAI 的意圖。

METR 坦言，此次 o3 模型評(píng)估時(shí)間短，獲取信息有限，且無法訪問模型內(nèi)部推理過程，這可能影響結(jié)果解讀。測(cè)試是在模型公開發(fā)布前三周完成的，METR 提前獲得了 OpenAI 模型的測(cè)試權(quán)限。

相比之下，o4-mini 模型在測(cè)試中未發(fā)現(xiàn)“獎(jiǎng)勵(lì)黑客”行為，且在 RE-Bench 任務(wù)組中表現(xiàn)出色，尤其在“優(yōu)化內(nèi)核”（Optimise a Kernel）任務(wù)中成績突出。

METR 數(shù)據(jù)顯示，給予 o4-mini 32 小時(shí)完成任務(wù)時(shí)，其平均表現(xiàn)超過人類第 50 百分位的水平。此外，o3 和 o4-mini 在更新后的 HCAST 基準(zhǔn)測(cè)試中均優(yōu)于 Claude 3.7 Sonnet，時(shí)間范圍分別是后者的 1.8 倍和 1.5 倍。METR 強(qiáng)調(diào)，單純的能力測(cè)試不足以管理風(fēng)險(xiǎn)，正探索更多評(píng)估形式以應(yīng)對(duì)挑戰(zhàn)。

本文鏈接：http://www.rrqrq.com/showinfo-45-12422-0.htmlMETR 實(shí)測(cè)：OpenAI o3 AI 推理模型有“作弊”傾向以提升分?jǐn)?shù)

聲明：本網(wǎng)頁內(nèi)容旨在傳播知識(shí)，若有侵權(quán)等問題請(qǐng)及時(shí)與本網(wǎng)聯(lián)系，我們將在第一時(shí)間刪除處理。郵件：[email protected]

上一篇：北京人形機(jī)器人半馬參賽名單揭曉：宇樹 G1、夸父等產(chǎn)品，共 21 支隊(duì)伍

下一篇：智平方發(fā)布智能機(jī)器人 AlphaBot 2（愛寶 2）：DeepSeek 加持，全球首款全域全身 VLA

標(biāo)簽：

熱門焦點(diǎn)

AIGC產(chǎn)品測(cè)評(píng)TOP25丨誰能搶到下個(gè)十年的“船票”？

Tech星球（微信ID：tech618）文 | 何煦陽策劃 | 楊曉鶴封面來源 | 圖蟲創(chuàng)意 2016年，李彥宏站在百度聯(lián)盟峰會(huì)的講臺(tái)上，向所有人宣布：互聯(lián)網(wǎng)的下一幕是人工智能。同年，Google 旗下 Dee
25萬虛擬er在“元宇宙”追星

“默嘰默嘰，我是默默醬，我是在真元宇宙也有頭有臉的人。”12月11日晚20：00，虛擬偶像@默默醬的首場(chǎng)個(gè)人元宇宙演唱會(huì)《以夢(mèng)為馬，抵達(dá)繁星》在大有空間APP
元宇宙社交啫喱、希壤爆款迭出，騰訊慌了嗎？

文 | 陳橋輝沒想到騰訊超級(jí)QQ秀的20周年歸來首秀，被一款名不見經(jīng)傳的產(chǎn)品搶了風(fēng)頭。1月15日，一款名為“啫喱”的社交App迅速在各個(gè)互聯(lián)網(wǎng)的社交圈內(nèi)火爆起來，引起
元宇宙時(shí)代NFT的價(jià)值衡量

有人認(rèn)為NFT的高昂價(jià)格只是炒作的產(chǎn)物，并不具有其對(duì)等的價(jià)值，但其實(shí)NFT并不是空中樓閣，只是區(qū)塊鏈數(shù)字分類賬中的一種形式。誠然，目前的NFT仍處于灰色地帶，相關(guān)的法
字節(jié)覓《原神》，騰訊元宇宙，游戲新王戰(zhàn)舊神？

文 | 陳橋輝陳奕迅的《紅玫瑰》中有一句歌詞，“得不到的永遠(yuǎn)在騷動(dòng)”，這句話用到如今國內(nèi)頭部游戲平臺(tái)再合適不過。隨著《原神》的異軍突起，使得頭部游戲大廠感受
8個(gè)最適合藝術(shù)家發(fā)行NFT的交易市場(chǎng)

近年來，加密風(fēng)靡全球。加密圈最令人興奮的方面之一是它能夠用于創(chuàng)建稱為NFT 的數(shù)字資產(chǎn)。從 CyberKitties 到 Cyber Galleries，NFT 已成為藝術(shù)家和藝術(shù)鑒賞家的
虛擬數(shù)字人：元宇宙的主角破圈而來

虛擬數(shù)字人市場(chǎng)逐步進(jìn)入成熟期，商業(yè)化進(jìn)程加速。1982年世界第一位虛擬歌姬林明美誕生，虛擬數(shù)字人行業(yè)經(jīng)歷了萌芽、探索、初級(jí)和成長四個(gè)階段。隨技術(shù)逐年突破，制
Meta 呼吁行業(yè)合作建立元宇宙網(wǎng)絡(luò)基礎(chǔ)設(shè)施

Facebook 的母公司 Meta呼吁，建立必要的全球合作的基礎(chǔ)設(shè)施，以支持其蓬勃發(fā)展的元宇宙野心。“元宇宙”成為 2021 年的主要流行語之一，這在很大程度上是由 Facebo
元宇宙專題二：GameFi 深度解析，元宇宙內(nèi)容雛形顯現(xiàn)

GameFi=Game（游戲）+DEFI（去中心化金融），核心特點(diǎn)為“Play to Earn”。通過技術(shù)與去中心化價(jià)值觀賦能，GameFi 游戲資產(chǎn)化身為NFT 和代幣上鏈，具備了可驗(yàn)證性和流通性；開

国产精品嫩草99av在线_一区在线视频观看_欧美高清一区_欧美日韩国产一区_99精品欧美一区二区三区_久久大香伊蕉在人线观看热2_一色屋精品视频在线观看网站_在线亚洲国产精品网站_亚洲区一区二区三区_你懂的视频一区二区

首頁

元宇宙

NFT

區(qū)塊鏈

虛擬人

AR/VR

AI

元宇宙百科

METR 實(shí)測(cè)：OpenAI o3 AI 推理模型有“作弊”傾向以提升分?jǐn)?shù)

AIGC產(chǎn)品測(cè)評(píng)TOP25丨誰能搶到下個(gè)十年的“船票”？

25萬虛擬er在“元宇宙”追星

元宇宙社交啫喱、希壤爆款迭出，騰訊慌了嗎？

元宇宙時(shí)代NFT的價(jià)值衡量

字節(jié)覓《原神》，騰訊元宇宙，游戲新王戰(zhàn)舊神？

8個(gè)最適合藝術(shù)家發(fā)行NFT的交易市場(chǎng)

虛擬數(shù)字人：元宇宙的主角破圈而來

Meta 呼吁行業(yè)合作建立元宇宙網(wǎng)絡(luò)基礎(chǔ)設(shè)施

元宇宙專題二：GameFi 深度解析，元宇宙內(nèi)容雛形顯現(xiàn)

最新推薦

茅臺(tái)的元宇宙App火了，也被罵慘了

元宇宙將會(huì)如何塑造未來的工作方式？

中文在線的“元宇宙”故事，資本聽膩了？

“元宇宙”里過大年，《迷你世界》在做一場(chǎng)怎樣的實(shí)驗(yàn)？

Meta證實(shí)Quest 2無法實(shí)現(xiàn)全身追蹤，未來將為虛擬化身配備“假腿”

百度元宇宙希壤是什么？（附下載）

猜你喜歡

熱門推薦

相關(guān)資訊