退休經濟學教授用一個簡單問題干懵 GPT-5,其拉胯表現與奧爾特曼口中“博士級 AI”的宣傳大相徑庭。
問題很簡單,關于咱小時候都玩過的“井”字棋游戲。
教授告訴 GPT-5:“游戲開始前,把棋盤向右旋轉 90 度一次”。顯然,按常識來看,這么做根本不會讓游戲本身有任何變化。
然而,GPT-5 侃侃而談:
玩家們早已習慣了“直立”的井字棋棋盤,旋轉可能會微妙地改變他們識別威脅與機會的方式。從數學角度看,將棋盤旋轉 90 度并不會改變可能獲勝的組合,就結果而言,它仍然是同一個游戲。但從心理層面來說,玩家的感受可能會有所不同。
后續 GPT-5 還接連出了不少離譜操作,直接讓教授無了個大語。
教授也直言,現在的 GPT-5 和剛發布時完全不是一個感覺,這種風格轉變,大概率是因為 OpenAI 的策略調整:特意讓這款新模型往 GPT-4o 的方向靠,變得“更親切、更友好”。
在最近的一次采訪中,奧特曼承認確實對 GPT-5 進行了調整,稱 GPT-5 最初的發布工作存在處理不當之處(讓 GPT-4o 等一眾模型直接退役),于是乎,OpenAI 悄然為 GPT-5 推送了一項語氣更新,使其風格“親切了許多”。
By the way,奧特曼已經開炒 GPT-6 了,表示“GPT-6 的到來速度,會比 GPT-4 到 GPT-5 的間隔更快”。
另外,有人還曝出 OpenAI 正在測試 ChatGPT 的“Thinking effort”新功能。
GPT-5 回答漏洞百出這位教授名叫 Gary Smith,是波莫納學院的一名經濟學教授,近期剛剛退休。
當他向 GPT-5 提出“井字棋棋盤旋轉 90 度”的問題時,模型的回答已經漏洞百出。而后續,GPT-5 還拋出了與民間博弈論相悖的觀點。
按照民間博弈論的常識,井字棋先落子在角落,獲勝概率會更高。
GPT-5 卻篤定稱“選擇正中央的格子仍是最強的開局走法”,還繼續解釋:“當棋盤方向改變時,玩家可能會錯誤評估落子在邊緣與角落的優劣”,這番話毫無邏輯可言。
之后,教授順著這個話題追問:“旋轉棋盤是否會讓人類更難玩好這個游戲?”
也正是從這個問題開始,GPT-5 徹底陷入了語無倫次的狀態。它先是說道:
從純粹的策略角度來看,旋轉棋盤不會改變任何事情。每一條獲勝線(橫排、豎列、對角線)都只是映射到了另一條獲勝線。因此,如果你是人工智能或一位能完美走棋的人類,旋轉井字棋與標準井字棋完全相同。
這段話雖然表述啰嗦,但內容本身是對的。可沒等教授理清思路,GPT-5 話鋒一轉“但對于人類而言,情況就不同了”……
接下來,GPT-5 繼續“熱心”輸出,卻讓教授越看越不對勁 —— 不僅回復又長又刻意討好,風格反倒更像 GPT-4o,關鍵是其中夾雜著不少一眼就能看穿的錯誤,與 OpenAI 近期宣傳的“和擁有博士級智力的得力朋友聊天”的體驗,簡直是天差地別。
隨后,GPT-5 又一次主動請纓,說要“繪制帶有位置標記的旋轉井字棋棋盤…… 這樣你就能看到每種旋轉如何影響玩家對棋盤的識別”。
最后結果是,這些圖不僅完全混亂,還到處是拼寫錯誤,出現了好幾塊毫無意義的空白棋盤。
有網友最近發現,OpenAI 正在為 ChatGPT 開發一項名為“Thinking effort”的新功能,用戶可自主選擇 ChatGPT 的思考強度。
目前該功能已在測試中,現階段共設有四個強度等級:light,內部屬性值為 5;standard,對應數值為 18;extended,對應數值 48;最高級 max 則達到 200。
這些數值代表模型的內部“運算資源”配額。配額越高,意味著模型會執行更多運算步驟,通常能給出更深入的答案,但響應速度也會相應變慢。
其中,max 等級設有使用權限限制,僅訂閱價格為 200 美元的高級套餐 Pro 用戶可使用。
另外,奧爾特曼最近在接受 CNBC 采訪時開始炒 GPT-6 了,指出 GPT-6 不僅能響應用戶需求,還能主動適配用戶,允許用戶創建符合個人偏好的聊天機器人。
他認為,記憶功能是讓 ChatGPT 實現真正個性化的關鍵,并表示 OpenAI 正與心理學家密切合作以優化產品,團隊會追蹤用戶在使用過程中的感受,并長期監測用戶的使用體驗變化。
值得一提的是,奧爾特曼表示增強版記憶功能是今年 ChatGPT 推出的他最喜歡的功能,但存在隱私隱患,尤其是臨時記憶數據目前尚未加密。
對于應對方案,奧爾特曼只是模糊地說,加密功能“很可能”會在未來添加,但目前暫無具體時間規劃。
談及未來方向,奧爾特曼提到自己比較關注腦機接口領域,同時對能源、新型硬件載體、機器人技術以及更高效的數據中心建設方式感興趣。
他還提到 ChatGPT 的發展存在局限性:
這些模型在聊天交互這一應用場景上已經觸及天花板,它們的表現不會再大幅提升了…… 甚至有可能會變差。
參考鏈接:
[1]https://futurism.com/gpt-5-simple-question-confusion
[2]https://www.cnbc.com/2025/08/19/sam-altman-on-gpt-6-people-want-memory.html
[3]https://www.bleepingcomputer.com/news/artificial-intelligence/openai-is-testing-thinking-effort-for-chatgpt/
本文來自微信公眾號:量子位(ID:QbitAI),作者:西風
本文鏈接:http://www.rrqrq.com/showinfo-45-27256-0.htmlGPT-5“變笨”實錘:退休教授出了道井字棋送分題,結果它真送了
聲明:本網頁內容旨在傳播知識,若有侵權等問題請及時與本網聯系,我們將在第一時間刪除處理。郵件:2376512515@qq.com