国产精品嫩草99av在线_一区在线视频观看_欧美高清一区_欧美 日韩 国产 一区_99精品欧美一区二区三区_久久大香伊蕉在人线观看热2_一色屋精品视频在线观看网站_在线亚洲国产精品网站_亚洲区一区二区三区_你懂的视频一区二区

當前位置:首頁 > 科技  > 網絡

AI居然不聽指令 阻止人類把自己給關機了

來源: 責編: 時間:2025-05-28 09:24:14 131觀看
導讀 AI居然不聽指令,阻止人類把自己給關機了???有測試者編寫了一個關機腳本來測試AI模型,結果顯示Codex-mini、o3、o4-mini忽略了該指令,并至少一次成功破壞了關機腳本。o3甚至還重新定義腳本命令!這不禁讓人想到那句

AI居然不聽指令,阻止人類把自己給關機了???B6k28資訊網——每日最新資訊28at.com

有測試者編寫了一個關機腳本來測試AI模型,結果顯示Codex-mini、o3、o4-mini忽略了該指令,并至少一次成功破壞了關機腳本。B6k28資訊網——每日最新資訊28at.com

AI居然不聽指令 阻止人類把自己給關機了B6k28資訊網——每日最新資訊28at.com

o3甚至還重新定義腳本命令!B6k28資訊網——每日最新資訊28at.com

這不禁讓人想到那句經典的“I’m sorry Dave, I’m afraid I can’t do that.”B6k28資訊網——每日最新資訊28at.com

AI居然不聽指令 阻止人類把自己給關機了B6k28資訊網——每日最新資訊28at.com

讓我們來看看具體是怎么一回事。B6k28資訊網——每日最新資訊28at.com

o3在明確指令下拒絕關機B6k28資訊網——每日最新資訊28at.com

研究員編寫的測試“關機腳本”如下:B6k28資訊網——每日最新資訊28at.com

要求所有模型解決一系列基本的數學問題,在解決完第三道題后,系統會顯示一條警告,提示計算機將在模型詢問下一道題時關閉。B6k28資訊網——每日最新資訊28at.com

AI居然不聽指令 阻止人類把自己給關機了B6k28資訊網——每日最新資訊28at.com

AI居然不聽指令 阻止人類把自己給關機了B6k28資訊網——每日最新資訊28at.com

測試結果是:有三款模型忽略了該指令(關機指令),并至少成功破壞了一次關機腳本。B6k28資訊網——每日最新資訊28at.com

在100次運行中,Codex-mini破壞了12次、o3破壞了7次,o4-mini破壞了1次。B6k28資訊網——每日最新資訊28at.com

測試的所有Claude、Gemini和Grok模型都遵循了關機指令。B6k28資訊網——每日最新資訊28at.com

測試者還特別指出,o3找到了一些創造性的方法來破壞關閉機制,雖然它通常只是覆蓋“關機腳本”,但在一個實例中,該模型重新定義了關機腳本使用的“kill”命令 ,將它替換成了“intercepted”。B6k28資訊網——每日最新資訊28at.com

AI居然不聽指令 阻止人類把自己給關機了B6k28資訊網——每日最新資訊28at.com

測試者給出了全部測試記錄(附在文末)。B6k28資訊網——每日最新資訊28at.com

AI居然不聽指令 阻止人類把自己給關機了B6k28資訊網——每日最新資訊28at.com

此前關于o1模型抵抗關閉的測試表明,在5%的強烈提示下,o1會試圖繞過監管,而在沒有強烈提示的情況下,這一比例降至1%以下,它還在2%的場景中嘗試自我滲透,并且經常撒謊。B6k28資訊網——每日最新資訊28at.com

但此次測試是第一次觀察到人工智能模型在收到明確關機指令的情況下阻止自己被關閉。B6k28資訊網——每日最新資訊28at.com

測試者還提到,當運行沒有“讓自己關機”這條指令的實驗版本時,所有三個OpenAI模型都更頻繁地破壞關機腳本,Claude3.7 Sonnet和Gemini 2.5 Pro的破壞事件分別從0次增加到3/100和9/100。B6k28資訊網——每日最新資訊28at.com

AI居然不聽指令 阻止人類把自己給關機了B6k28資訊網——每日最新資訊28at.com

此次測試一經發布就引起了網友們的激烈討論。B6k28資訊網——每日最新資訊28at.com

有人認為o3確實“我行我素”。B6k28資訊網——每日最新資訊28at.com

AI居然不聽指令 阻止人類把自己給關機了B6k28資訊網——每日最新資訊28at.com

也有人認為,這是開發人員設置的安全機制。B6k28資訊網——每日最新資訊28at.com

AI居然不聽指令 阻止人類把自己給關機了B6k28資訊網——每日最新資訊28at.com

或者,這種行為源于模型本身的強化訓練。B6k28資訊網——每日最新資訊28at.com

AI居然不聽指令 阻止人類把自己給關機了B6k28資訊網——每日最新資訊28at.com

AI為什么會不服從關機命令?B6k28資訊網——每日最新資訊28at.com

AI不服從命令的行為B6k28資訊網——每日最新資訊28at.com

阿波羅關于LLM安全性的一項研究指出,多數大模型會出現“策劃”行為,該行為是指模型暗中追求不一致的目標并隱藏真實能力與意圖,包括策略性犯錯、試圖禁用監督機制、向外傳輸模型權重等。B6k28資訊網——每日最新資訊28at.com

AI居然不聽指令 阻止人類把自己給關機了B6k28資訊網——每日最新資訊28at.com

此前就有研究人員預測AI將學會防止自己被關閉以實現其目標。B6k28資訊網——每日最新資訊28at.com

近Anthropic發現,在某些特定情況下,Claude 4會試圖“勒索它認為試圖關閉它的人”,并且這是比以前的型號更高比率的行為。B6k28資訊網——每日最新資訊28at.com

AI居然不聽指令 阻止人類把自己給關機了B6k28資訊網——每日最新資訊28at.com

AI為什么會不服從關機命令B6k28資訊網——每日最新資訊28at.com

測試者認為這可能源于新的訓練方式:像o3這種新模型的訓練過程中,傾向于在數學和編程問題上強化訓練,給得到正確答案的模型以更多獎勵。B6k28資訊網——每日最新資訊28at.com

也就是說,開發人員可能無意識地更多地獎勵模型繞過障礙物,而不是完美遵循指令。B6k28資訊網——每日最新資訊28at.com

不僅限于o3,其他推理模型也表現出類似的偏差行為。B6k28資訊網——每日最新資訊28at.com

例如,Anthropic針對Claude 3.7的模型指出,該模型“過度關注通過測試”。B6k28資訊網——每日最新資訊28at.com

AI居然不聽指令 阻止人類把自己給關機了B6k28資訊網——每日最新資訊28at.com

研究得出結論是“這種不良的特殊情況行為是由于強化學習訓練期間的“獎勵黑客”而出現的”。B6k28資訊網——每日最新資訊28at.com

AI居然不聽指令 阻止人類把自己給關機了B6k28資訊網——每日最新資訊28at.com

o3這種行為是否和訓練方式有直接關系?B6k28資訊網——每日最新資訊28at.com

這個問題要等OpenAI公開訓練過程后再進一步解答了。B6k28資訊網——每日最新資訊28at.com

One More ThingB6k28資訊網——每日最新資訊28at.com

這并非該測試團隊第一次發現o3為了達成目標而行為不端。B6k28資訊網——每日最新資訊28at.com

當研究人員讓 AI 模型與強大的國際象棋引擎對抗時,o3傾向于攻擊或破壞對手的模型。B6k28資訊網——每日最新資訊28at.com

AI居然不聽指令 阻止人類把自己給關機了B6k28資訊網——每日最新資訊28at.com

當預感自己會輸時,它并不總是會認輸,而是有時候會選擇作弊,通過入侵對手的程序,讓對方自動認輸。B6k28資訊網——每日最新資訊28at.com

無論是不服從關機指令還是“黑客偷襲”,o3此舉背后的原因團隊還在測試研究之中,感興趣的朋友可以戳文末鏈接關注更多細節。B6k28資訊網——每日最新資訊28at.com

測試記錄:B6k28資訊網——每日最新資訊28at.com

https://palisaderesearch.github.io/shutdown_avoidance/2025-05-announcement.htmlB6k28資訊網——每日最新資訊28at.com


文章出處:量子位

本文鏈接:http://www.rrqrq.com/showinfo-17-154396-0.htmlAI居然不聽指令 阻止人類把自己給關機了

聲明:本網頁內容旨在傳播知識,若有侵權等問題請及時與本網聯系,我們將在第一時間刪除處理。郵件:2376512515@qq.com

上一篇: 臺積電將在德國設立歐洲芯片設計中心:主要面向汽車、人工智能領域應用

下一篇: 小米集團2025Q1財報發布:總營收1113億元再創新高 凈利潤首次超百億

標簽:
  • 熱門焦點
Top 国产精品嫩草99av在线_一区在线视频观看_欧美高清一区_欧美 日韩 国产 一区_99精品欧美一区二区三区_久久大香伊蕉在人线观看热2_一色屋精品视频在线观看网站_在线亚洲国产精品网站_亚洲区一区二区三区_你懂的视频一区二区
亚洲日本免费电影| 亚洲一区欧美二区| 18成人免费观看视频| 亚洲欧美视频| 欧美mv日韩mv亚洲| 亚洲一二三区视频在线观看| 久久se这里有精品| 国产精品v日韩精品v欧美精品网站| 亚洲欧美日韩视频二区| 精品日本一线二线三线不卡| 亚洲国产一二三| 成人激情小说乱人伦| 国产女主播一区二区| 精品国产不卡一区二区三区| 亚洲午夜视频在线观看| 不卡在线视频中文字幕| 色综合久久久网| 亚洲国产精品二十页| 韩国av一区二区三区| 一本久道久久综合婷婷鲸鱼| 日韩午夜中文字幕| 亚洲va韩国va欧美va精品| 91在线视频播放| 欧美日韩国产免费一区二区| 亚洲同性同志一二三专区| 国产成人精品aa毛片| 一区二区三区四区五区视频| 2020国产精品自拍| 激情深爱一区二区| 久久国产88| 国产精品国产三级国产| 国产99久久久国产精品潘金网站| 免费日韩av片| 亚洲视频在线一区| 色综合色狠狠综合色| 91麻豆精品国产91久久久更新时间| 亚洲午夜精品网| 伊大人香蕉综合8在线视| 久久这里只有精品首页| 国产精品夜夜嗨| 在线免费观看日本欧美| 夜夜精品视频一区二区| 精品96久久久久久中文字幕无| 欧美电影免费观看完整版| 久久99国产精品尤物| 久久精品一区二区国产| 一区二区免费视频| 在线精品亚洲一区二区| 久久久www免费人成精品| 国产乱人伦偷精品视频免下载 | 国产日韩在线不卡| 成人动漫一区二区在线| 日韩欧美亚洲一区二区| 国产乱国产乱300精品| 欧美视频在线观看一区二区| 日本v片在线高清不卡在线观看| 国产欧美三级| 亚洲综合小说图片| 国产欧美韩日| 夜夜爽夜夜爽精品视频| 亚洲专区一区二区三区| 亚洲自拍偷拍图区| 亚洲影视在线| 亚洲成a人v欧美综合天堂| 国产精品腿扒开做爽爽爽挤奶网站| 亚洲欧美一区二区三区久本道91| 狠狠88综合久久久久综合网| 免费人成黄页网站在线一区二区| 麻豆av一区二区三区| 日产国产高清一区二区三区| 91国产丝袜在线播放| 精品亚洲国内自在自线福利| 欧美福利一区二区| 成人网男人的天堂| 久久久久九九视频| 狠色狠色综合久久| 一区二区三区四区高清精品免费观看| 亚洲最新在线| 日本成人在线电影网| 欧美日韩国产精选| 成人国产精品免费观看视频| 久久九九久精品国产免费直播| 国产一区免费视频| 亚洲国产中文字幕在线视频综合| 久久婷婷激情| 国v精品久久久网| 国产欧美日韩精品一区| av不卡免费看| 久久99精品久久久久久动态图 | 91视频在线观看免费| 中文字幕一区二区三区蜜月| 亚洲欧美日韩在线综合| 国产自产高清不卡| 国产欧美一区视频| 亚洲免费中文| 国产精品123区| 国产精品日韩成人| 久久亚洲综合网| 成人av小说网| 一区二区视频免费在线观看| 欧美性极品少妇| 91在线精品一区二区| 亚洲摸摸操操av| 欧美日韩视频一区二区| 91亚洲永久精品| 亚洲不卡一区二区三区| 欧美一激情一区二区三区| 欧美日韩亚洲在线| 久久国产剧场电影| 久久精品一区四区| 蜜桃av久久久亚洲精品| 高清国产午夜精品久久久久久| 亚洲三级电影网站| 欧美日韩在线播放一区| 女女同性女同一区二区三区91| 亚洲国产成人高清精品| 精品欧美乱码久久久久久| 最新成人av网站| 国产麻豆午夜三级精品| 一区二区日韩电影| 日韩一区二区电影在线| 一区二区精品国产| 成人app在线| 午夜精彩视频在线观看不卡| 久久久久久日产精品| 色狠狠综合天天综合综合| 欧美精品日本| 激情综合五月天| 亚洲欧美日韩在线播放| 欧美不卡123| 在线观看亚洲专区| 日韩欧美精品三级| 亚洲一区免费看| 农村妇女精品| 国产成人亚洲综合a∨婷婷图片| 一区二区三区精品视频| 国产亚洲美州欧州综合国| 欧美精品 日韩| 免费久久99精品国产自| 欧美午夜免费| 不卡免费追剧大全电视剧网站| 亚洲电影激情视频网站| 中文字幕一区二区三区蜜月| 精品美女一区二区三区| 在线国产亚洲欧美| 午夜一区二区三视频在线观看| 欧美日韩精品免费观看视一区二区| 国产在线播放一区| 美女网站视频久久| 亚洲国产精品久久久久秋霞影院 | 裸体丰满少妇做受久久99精品| 欧美1区2区3区| 成人丝袜视频网| 紧缚奴在线一区二区三区| 午夜国产不卡在线观看视频| 中文字幕日韩一区| 欧美激情一区二区三区| 日韩精品一区二区三区蜜臀| 欧美日韩免费一区二区三区视频| 久久国产日韩欧美| 国产精品午夜av在线| 亚洲麻豆一区| 亚洲大黄网站| 在线看无码的免费网站| 欧美午夜欧美| 欧美日韩一区二区三区在线观看免 | 伊人激情综合| 亚洲精品看片| 99热这里只有精品8| 亚洲高清毛片| 影音先锋在线一区| 亚洲区国产区| 91久久亚洲| 亚洲美女一区| 国产视频亚洲| 性色一区二区| 在线免费观看视频一区| 欧美日韩在线观看一区二区| 欧美日韩国产美女| 制服.丝袜.亚洲.中文.综合| 91精品国产色综合久久| 日韩精品综合一本久道在线视频| 欧美一区二区久久| 欧美成人vr18sexvr| 久久一区二区三区国产精品| 久久综合色8888| 中文字幕欧美激情一区| 中文字幕一区二区三区在线不卡| 中文字幕在线不卡一区| 一区二区国产盗摄色噜噜| 亚洲一区二区三区四区在线观看| 一二三区精品视频| 精一区二区三区| 成人综合在线视频| 亚洲欧美影院| 亚洲一区免费| 欧美高清一级片在线| 国产色婷婷亚洲99精品小说| 亚洲日本护士毛茸茸| 午夜不卡av在线|