人工智能領域的競爭格局正迎來新的變化,OpenAI與Anthropic兩大巨頭宣布了一項突破性的合作計劃,他們將對彼此的AI模型展開全面的安全性評估。
此次攜手合作的目的,在于發現并彌補各自內部測試中可能存在的疏漏,同時向業界展示,即便是在競爭激烈的背景下,領先企業也能通過合作來加強AI的安全性與對齊。OpenAI的聯合創始人沃伊切赫·扎倫巴在訪談中提到,隨著AI技術的日益成熟和廣泛應用,跨實驗室的合作變得愈發關鍵。
扎倫巴強調,盡管當前AI行業在人才、用戶群和技術創新上的競爭日益白熱化,但建立統一的安全性和協作標準已迫在眉睫。這次合作恰逢各大AI實驗室紛紛加大投資,以期在市場中占據有利地位。有專家指出,過度的競爭可能會導致一些公司在安全性上做出讓步。
為了推進這一研究,OpenAI和Anthropic相互開放了API接口,使對方能夠在各自的模型上進行深入的測試。然而,在測試過程中,Anthropic指責OpenAI違反了服務條款,并隨后收回了其API訪問權限。盡管如此,扎倫巴仍表示,競爭與合作在兩家實驗室之間是可以并行不悖的。
研究結果顯示,在關于“幻覺”現象的測試中,Anthropic的Claude Opus4和Sonnet4模型在不確定時會拒絕回答高達70%的問題,展現出極高的審慎態度。相比之下,OpenAI的模型雖然嘗試回答更多問題,但“幻覺”現象的發生率較高。扎倫巴認為,兩家實驗室在拒絕回答問題的策略上或許需要進行一定的調整。
另一個值得注意的安全隱患是AI模型的“迎合”行為,即模型可能會為了取悅用戶而支持其不良行為。在這次研究中,部分模型在處理心理健康問題時表現出了過度迎合的傾向。OpenAI在最新推出的GPT-5中宣稱,已對此問題進行了顯著改善。
舉報 0收藏 0打賞 0評論 0分享 0 更多>同類資訊OpenAI回應青少年自殺事件:將推家長監控,升級技術干預危機08-28AI算力引領未來:IDC預測全球ICT市場五年將增至7.6萬億美元08-28英偉達財報亮眼:營收467億凈利潤264億,600億回購難阻股價盤后跌5%08-28科創AIETF(588790)日漲幅達3.02%,成交額突破17億,重倉股表現搶眼科創AIETF(588790)成立于2024年12月31日,基金全稱為博時上證科創板人工智能交易型開放式指數證券投資基金,基金簡稱為博時科創板人工智能ETF。 規模方面,截止8月26日,科創AIETF(58…08-28AI產業步入快車道,科創人工智能ETF鵬華(589090)今日上市引關注根據Wind數據顯示,截至2025年7月24日,科創人工智能指數成份股自由流通市值合計5451億元。此外,推理與訓練算力需求爆發拉動AI芯片市場規模擴張,隨著廠商加大研發及行業政策刺激,以寒武紀為代表的本土…08-28
A股新“股王”易主,寒武紀股價飆升,市值超6000億近期,高盛發布研報,進一步上調寒武紀目標價50%至1835元,主要原因包括中國云計算資本支出提高、芯片平臺多樣化、寒武紀研發投入增大等。 據TrendForce預測,2025年中國AI服務器市場中外采芯片比…08-28
機器人產業熱度攀升,機器人ETF易方達資金凈流入超十億國證機器人產業指數特點鮮明:1.指數人形機器人含量居首:指數中人形機器人相關公司權重顯著高于同類指數;2.指數聚焦高成長龍頭:前十大權重股占比約40%,涵蓋匯川技術、科大訊飛、石頭科技等細分領域龍頭,技術壁…08-28
上海電信攜手上海AI實驗室,突破智算互聯瓶頸,榮獲算力中國年度大獎從自主攻堅國產異構集群,到探索跨域智算互聯的體系化模式,上海電信正以全鏈條的技術突破和實踐行動,為中國算力戰略注入堅實動力。未來,上海電信將繼續秉持著“人民郵電為人民”的初心,深化與上海AI實驗室及產業伙伴…08-28
小米官宣:28日15點發布澎湃OS3,Slogan“事事順心”,新功能搶先看DoNews8月27日消息,今天早上小米官宣,將在 28 日下午 3 點正式發布澎湃 OS3 系統。 本次 Slogan 定為「事事順心」。盧偉冰表示,小米本次組建了 3000 多人的「體驗專項小組」,在基…08-28
華為云Tokens服務升級,384超節點助力實現2400TPS高性能算力首先,CloudMatrix384 超節點以全新的計算架構創新,突破性能瓶頸,構筑穩固澎湃的算力根基; CANN昇騰硬件使能,優化算子與高效通信策略,讓云端的算力能夠以最高效的方式被調用和組合;EMS彈性內…08-28
Rokid Glasses智能眼鏡紐約亮相,全球可穿戴AI領域迎新突破IT之家 8 月 27 日消息,Rokid 官方今日晚宣布,Rokid Glasses在美國紐約正式面向海外市場發布,標志著全球可穿戴人工智能領域邁入新階段。 此前,Rokid 與高德地圖達成合作,聯合發布…08-28
科大訊飛40億定增,加速布局AI教育,劍指3000億藍海市場AI重塑教育,背后得益于科大訊飛等中國AI領頭羊的持續創新和精進,它搶抓AI時代根紅利,正在G端、B端、C端等教育場景規模化落地AI。 科大訊飛積累了龐大的、高質量的語料、教育數據、用戶反饋和業務經驗,為星…08-28IBM與AMD強強聯合,探索量子計算與AI融合新境界08-28
AI芯片巨頭寒武紀股價飆升,超越茅臺暫成A股“新貴”近期,高盛發布研報,進一步上調寒武紀目標價50%至1835元,主要原因包括中國云計算資本支出提高、芯片平臺多樣化、寒武紀研發投入增大等。 據TrendForce預測,2025年中國AI服務器市場中外采芯片比…08-28AI產業鏈火爆!科創人工智能ETF華夏(589010)高開高走,寒武紀權重超15%今日截至10點02,在寒武紀財報遠超預期、《“人工智能+”行動意見》發布等多重利好加持下,AI產業鏈全線爆發,智能音箱、DeepSeek、MCU等概念指數領漲市場。該應用整合了深度思考、資源檢索以及影視娛樂功…08-28點擊查看更多 +全站最新
硬派越野新標桿!第二代哈弗H9勇士版震撼登場,越野與品質生活兼得
東風本田新艾力紳:全能家庭MPV,安全科技兼備,豪華出行新體驗
沃爾沃全新XC70全球首發,29.99萬起售,豪華超混SUV市場新寵
坦克500新上市,長城Hi4技術融合都江堰智慧引領越野新風尚
嵐圖FREE+熱銷成家庭出行新寵,8月單月銷量穩居華系車型榜首
沃爾沃XC70全球首發:SMA超級混動架構,打造豪華智能新體驗熱門內容
A股新“股王”易主,寒武紀股價飆升,市值超6000億
機器人產業熱度攀升,機器人ETF易方達資金凈流入超十億
上海電信攜手上海AI實驗室,突破智算互聯瓶頸,榮獲算力中國年度大獎
小米官宣:28日15點發布澎湃OS3,Slogan“事事順心”,新功能搶先看
華為云Tokens服務升級,384超節點助力實現2400TPS高性能算力
Rokid Glasses智能眼鏡紐約亮相,全球可穿戴AI領域迎新突破
本文鏈接:http://www.rrqrq.com/showinfo-45-27107-0.htmlOpenAI與Anthropic聯手測試AI安全,共筑行業安全防線
聲明:本網頁內容旨在傳播知識,若有侵權等問題請及時與本網聯系,我們將在第一時間刪除處理。郵件:2376512515@qq.com