當前位置：首頁 > 元宇宙 > AI

GPT-5“變笨”實錘：退休教授出了道井字棋送分題，結果它真送了

來源：責編：時間：2025-09-04 13:30:34 53觀看

導讀退休經濟學教授用一個簡單問題干懵 GPT-5，其拉胯表現與奧爾特曼口中“博士級 AI”的宣傳大相徑庭。問題很簡單，關于咱小時候都玩過的“井”字棋游戲。教授告訴 GPT-5：“游戲開始前，把棋盤向右旋轉 90 度一次”。

退休經濟學教授用一個簡單問題干懵 GPT-5，其拉胯表現與奧爾特曼口中“博士級 AI”的宣傳大相徑庭。

問題很簡單，關于咱小時候都玩過的“井”字棋游戲。

教授告訴 GPT-5：“游戲開始前，把棋盤向右旋轉 90 度一次”。顯然，按常識來看，這么做根本不會讓游戲本身有任何變化。

然而，GPT-5 侃侃而談：

玩家們早已習慣了“直立”的井字棋棋盤，旋轉可能會微妙地改變他們識別威脅與機會的方式。從數學角度看，將棋盤旋轉 90 度并不會改變可能獲勝的組合，就結果而言，它仍然是同一個游戲。但從心理層面來說，玩家的感受可能會有所不同。

后續 GPT-5 還接連出了不少離譜操作，直接讓教授無了個大語。

教授也直言，現在的 GPT-5 和剛發布時完全不是一個感覺，這種風格轉變，大概率是因為 OpenAI 的策略調整：特意讓這款新模型往 GPT-4o 的方向靠，變得“更親切、更友好”。

在最近的一次采訪中，奧特曼承認確實對 GPT-5 進行了調整，稱 GPT-5 最初的發布工作存在處理不當之處（讓 GPT-4o 等一眾模型直接退役），于是乎，OpenAI 悄然為 GPT-5 推送了一項語氣更新，使其風格“親切了許多”。

By the way，奧特曼已經開炒 GPT-6 了，表示“GPT-6 的到來速度，會比 GPT-4 到 GPT-5 的間隔更快”。

另外，有人還曝出 OpenAI 正在測試 ChatGPT 的“Thinking effort”新功能。

GPT-5 回答漏洞百出

這位教授名叫 Gary Smith，是波莫納學院的一名經濟學教授，近期剛剛退休。

當他向 GPT-5 提出“井字棋棋盤旋轉 90 度”的問題時，模型的回答已經漏洞百出。而后續，GPT-5 還拋出了與民間博弈論相悖的觀點。

按照民間博弈論的常識，井字棋先落子在角落，獲勝概率會更高。

GPT-5 卻篤定稱“選擇正中央的格子仍是最強的開局走法”，還繼續解釋：“當棋盤方向改變時，玩家可能會錯誤評估落子在邊緣與角落的優劣”，這番話毫無邏輯可言。

之后，教授順著這個話題追問：“旋轉棋盤是否會讓人類更難玩好這個游戲？”

也正是從這個問題開始，GPT-5 徹底陷入了語無倫次的狀態。它先是說道：

從純粹的策略角度來看，旋轉棋盤不會改變任何事情。每一條獲勝線（橫排、豎列、對角線）都只是映射到了另一條獲勝線。因此，如果你是人工智能或一位能完美走棋的人類，旋轉井字棋與標準井字棋完全相同。

這段話雖然表述啰嗦，但內容本身是對的。可沒等教授理清思路，GPT-5 話鋒一轉“但對于人類而言，情況就不同了”……

接下來，GPT-5 繼續“熱心”輸出，卻讓教授越看越不對勁 —— 不僅回復又長又刻意討好，風格反倒更像 GPT-4o，關鍵是其中夾雜著不少一眼就能看穿的錯誤，與 OpenAI 近期宣傳的“和擁有博士級智力的得力朋友聊天”的體驗，簡直是天差地別。

隨后，GPT-5 又一次主動請纓，說要“繪制帶有位置標記的旋轉井字棋棋盤…… 這樣你就能看到每種旋轉如何影響玩家對棋盤的識別”。

最后結果是，這些圖不僅完全混亂，還到處是拼寫錯誤，出現了好幾塊毫無意義的空白棋盤。

Two More Things

有網友最近發現，OpenAI 正在為 ChatGPT 開發一項名為“Thinking effort”的新功能，用戶可自主選擇 ChatGPT 的思考強度。

目前該功能已在測試中，現階段共設有四個強度等級：light，內部屬性值為 5；standard，對應數值為 18；extended，對應數值 48；最高級 max 則達到 200。

這些數值代表模型的內部“運算資源”配額。配額越高，意味著模型會執行更多運算步驟，通常能給出更深入的答案，但響應速度也會相應變慢。

其中，max 等級設有使用權限限制，僅訂閱價格為 200 美元的高級套餐 Pro 用戶可使用。

另外，奧爾特曼最近在接受 CNBC 采訪時開始炒 GPT-6 了，指出 GPT-6 不僅能響應用戶需求，還能主動適配用戶，允許用戶創建符合個人偏好的聊天機器人。

他認為，記憶功能是讓 ChatGPT 實現真正個性化的關鍵，并表示 OpenAI 正與心理學家密切合作以優化產品，團隊會追蹤用戶在使用過程中的感受，并長期監測用戶的使用體驗變化。

值得一提的是，奧爾特曼表示增強版記憶功能是今年 ChatGPT 推出的他最喜歡的功能，但存在隱私隱患，尤其是臨時記憶數據目前尚未加密。

對于應對方案，奧爾特曼只是模糊地說，加密功能“很可能”會在未來添加，但目前暫無具體時間規劃。

談及未來方向，奧爾特曼提到自己比較關注腦機接口領域，同時對能源、新型硬件載體、機器人技術以及更高效的數據中心建設方式感興趣。

他還提到 ChatGPT 的發展存在局限性：

這些模型在聊天交互這一應用場景上已經觸及天花板，它們的表現不會再大幅提升了…… 甚至有可能會變差。

參考鏈接：

[1]https://futurism.com/gpt-5-simple-question-confusion

[2]https://www.cnbc.com/2025/08/19/sam-altman-on-gpt-6-people-want-memory.html

[3]https://www.bleepingcomputer.com/news/artificial-intelligence/openai-is-testing-thinking-effort-for-chatgpt/

本文來自微信公眾號：量子位（ID：QbitAI），作者：西風

本文鏈接：http://www.rrqrq.com/showinfo-45-27256-0.htmlGPT-5“變笨”實錘：退休教授出了道井字棋送分題，結果它真送了

聲明：本網頁內容旨在傳播知識，若有侵權等問題請及時與本網聯系，我們將在第一時間刪除處理。郵件：2376512515@qq.com

上一篇：快手：已上線 AI 內容標識，疑似 AI 內容也會提示

下一篇：優必選人形機器人Walker S2再創佳績，2.5億大單引領全球訂單新高度

標簽：

熱門焦點

人間誠實周鴻祎：360 All in 大模型的六個解讀

主筆 / 村口有牛文章架構師 / 毛自聰出品 / 巨頭財經5月至今，人間躁動，各路大模型你方唱罷我登場，VC圈互聯網圈媒體圈已近癲狂。誰也沒想到，今日，360再度刷屏，老牌互聯網巨頭展現
25萬虛擬er在“元宇宙”追星

“默嘰默嘰，我是默默醬，我是在真元宇宙也有頭有臉的人。”12月11日晚20：00，虛擬偶像@默默醬的首場個人元宇宙演唱會《以夢為馬，抵達繁星》在大有空間APP
企業熱、用戶冷，元宇宙第一站將是“營銷場”？

如果說2021年底什么最火熱，那元宇宙當之無愧?！叭f物皆可元宇宙”似乎成為新的流行語，在廣告中也常常聽到“社交元宇宙”“購物元宇宙”等等。就在近日，有消息傳
區塊鏈產業人才發展報告

工業和信息化部作為工業和信息化行業主管部門，正在著力推進“兩個強國”建設，加快推動以區塊鏈為代表的新興技術與實體經濟深度融合。我國區塊鏈技術和應用想要
全面擁抱“虛擬世界”，摩登天空要打造“音樂元宇宙”

作者：袁佳琦沈黎暉不怎么打游戲，但許多事兒在他眼里都“有意思”。好玩，有意思，是他的口頭禪，在接受娛樂獨角獸的采訪過程中，他多次提到，做虛擬音樂人，“是件挺好玩的
傳統互聯網與區塊鏈場景下數據權利法律分析

數據權益的復雜性在于數據涉及多環節多主體、內容不同質且與不同場景緊密聯系、對軟硬件技術環節緊密相關等方面的復雜性。在傳統互聯網與區塊鏈模式下，數據處
過去女性在互聯網領域是半邊天，在Web3，將會是整片天！

Web 2.0 是由幾家“直男”大公司塑造的。接下來的Web3世界中，如果女性在創造性方面發揮更大的作用，可能會讓這個新時代更受歡迎、更安全和公平。當我們談論 Web3
電影工業巨頭好萊塢計劃進軍元宇宙，將會對行業帶來什么影響？

元宇宙聽起來像不像是科幻小說中出現的術語？事實確實如此。小說家尼爾·斯蒂芬森在1992年的小說《雪崩》中首次用這個詞來定義了一個多連接的虛擬宇宙，它能夠模
在互聯網考古后，我被豆瓣上這座元宇宙古城征服了

最近一段時間，豆瓣可謂命途多舛：APP屢次下架，平臺也被相關部門約談、處罰，國家網信辦甚至派人入駐豆瓣以督促整改。有爆料稱豆瓣將陸續關閉“小組”功能：這個曾經小

国产精品嫩草99av在线_一区在线视频观看_欧美高清一区_欧美日韩国产一区_99精品欧美一区二区三区_久久大香伊蕉在人线观看热2_一色屋精品视频在线观看网站_在线亚洲国产精品网站_亚洲区一区二区三区_你懂的视频一区二区

首頁

元宇宙

NFT

區塊鏈

虛擬人

AR/VR

AI

元宇宙百科

GPT-5“變笨”實錘：退休教授出了道井字棋送分題，結果它真送了

人間誠實周鴻祎：360 All in 大模型的六個解讀

25萬虛擬er在“元宇宙”追星

企業熱、用戶冷，元宇宙第一站將是“營銷場”？

區塊鏈產業人才發展報告

全面擁抱“虛擬世界”，摩登天空要打造“音樂元宇宙”

傳統互聯網與區塊鏈場景下數據權利法律分析

過去女性在互聯網領域是半邊天，在Web3，將會是整片天！

電影工業巨頭好萊塢計劃進軍元宇宙，將會對行業帶來什么影響？

在互聯網考古后，我被豆瓣上這座元宇宙古城征服了

最新推薦

VR/AR迷失元宇宙“硝煙”

中國虛擬數字人如何橫向拓展市場需求，探索發展場景?

元宇宙是數字共識生態的集成邏輯表達

重溫 1602 年：DAO 是新的企業范式嗎？

a16z：元宇宙辦公會取代實體辦公室嗎？

虛擬人行業研究報告

猜你喜歡

熱門推薦

相關資訊