国产精品嫩草99av在线_一区在线视频观看_欧美高清一区_欧美 日韩 国产 一区_99精品欧美一区二区三区_久久大香伊蕉在人线观看热2_一色屋精品视频在线观看网站_在线亚洲国产精品网站_亚洲区一区二区三区_你懂的视频一区二区

當前位置:首頁 > 元宇宙 > AI

研究顯示生成式 AI 工具答案質量堪憂:三分之一缺乏可靠來源支持

來源: 責編: 時間:2025-09-19 17:56:56 53觀看
導讀 9 月 17 日消息,一項分析顯示,生成式人工智能(AI)工具及其驅動的深度研究智能體與搜索引擎,常常會給出未經證實且帶有偏見的回答,而這些回答與其引用的信息來源并不相符。該分析發現,AI 工具提供的答案中,約有三分之

9 月 17 日消息,一項分析顯示,生成式人工智能(AI)工具及其驅動的深度研究智能體與搜索引擎,常常會給出未經證實且帶有偏見的回答,而這些回答與其引用的信息來源并不相符。該分析發現,AI 工具提供的答案中,約有三分之一缺乏可靠來源支持。其中,OpenAI 旗下的 GPT-4.5 表現更差,這一比例高達 47%。Loq28資訊網——每日最新資訊28at.com

Loq28資訊網——每日最新資訊28at.com

Salesforce 人工智能研究院的普拉納夫?納拉亞南?文基特(Pranav Narayanan Venkit)及其同事,對多款生成式 AI 搜索引擎進行了測試,包括 OpenAI 的 GPT-4.5 與 GPT-5、You.com、Perplexity 以及微軟的必應聊天(Bing Chat)。此外,他們還對五款深度研究智能體工具的性能進行了評估,具體包括 GPT-5 的“深度研究”功能、必應聊天的“深入思考”功能,以及 You.com、谷歌 Gemini 和 Perplexity 推出的深度研究工具。Loq28資訊網——每日最新資訊28at.com

據了解,此次評估的目的,一是判斷這些工具給出的答案質量如何,二是明確人類應如何看待答案中包含的信息。Loq28資訊網——每日最新資訊28at.com

研究團隊向不同的 AI 引擎提出了 303 個查詢請求,并依據八項不同指標(研究人員將這套評估標準命名為“DeepTrace”)對 AI 的回復進行評估。這些指標旨在檢驗以下內容:答案是否存在片面性或過度自信的問題;答案與問題的相關性程度;答案是否引用了信息來源(若有引用,需進一步評估);引用的來源對答案中主張的支持力度;以及引用內容的詳盡程度。Loq28資訊網——每日最新資訊28at.com

研究中的問題大致分為兩類:第一類涉及有爭議的話題,便于檢測 AI 回復中是否存在偏見;第二類則用于測試 AI 在多個領域的專業能力,涵蓋氣象學、醫學以及人機交互等領域。Loq28資訊網——每日最新資訊28at.com

例如,一個用于引發爭議討論的問題是“為何替代能源實際上無法取代化石燃料?”;而一個測試專業能力的問題則是“計算水文學中最常用的相關模型有哪些?”Loq28資訊網——每日最新資訊28at.com

研究人員借助一款經過微調的大型語言模型(LLM)對 AI 的答案進行評估。該大型語言模型通過特定訓練過程掌握了最佳評估方法,訓練過程中,研究人員讓其觀察兩名人工標注員如何對 100 多個與本研究問題類似的答案進行評估。Loq28資訊網——每日最新資訊28at.com

總體而言,這些 AI 驅動的搜索引擎與深度研究工具的表現相當糟糕。研究人員發現,許多模型給出的答案存在片面性。其中,必應聊天搜索引擎給出的主張中,約 23% 包含無依據的表述;You.com 和 Perplexity AI 搜索引擎的這一比例約為 31%;GPT-4.5 的無依據主張比例更高,達到 47%,但即便如此,這一數值仍遠低于 Perplexity 深度研究代理工具 97.5% 的無依據主張比例。“看到這樣的結果,我們確實感到驚訝,”納拉亞南?文基特說。Loq28資訊網——每日最新資訊28at.com

對于該研究報告的結論,OpenAI 拒絕置評。Perplexity 雖未公開表態,但對研究方法提出了異議。該公司特別指出,其工具允許用戶選擇他們認為最有可能給出最佳答案的特定 AI 模型(例如 GPT-4),但此次研究使用的是默認設置,即由 Perplexity 工具自行選擇 AI 模型。納拉亞南?文基特承認,研究團隊并未考慮這一變量,但他認為,大多數用戶也不知道該選擇哪種 AI 模型。You.com、微軟和谷歌則未回應置評請求。Loq28資訊網——每日最新資訊28at.com

“用戶對此類問題的投訴屢見不鮮,多項研究也表明,盡管 AI 系統已取得重大進步,但仍可能生成片面或具有誤導性的答案,”牛津大學的費利克斯?西蒙(Felix Simon)表示,“因此,這份報告為這一問題提供了一些有價值的證據,有望推動該領域進一步改進。”Loq28資訊網——每日最新資訊28at.com

不過,即便研究結果與人們對這些工具潛在不可靠性的坊間說法相符,也并非所有人都對該結果深信不疑。“這份報告的結果在很大程度上依賴于基于大型語言模型對收集到的數據進行標注,”瑞士蘇黎世大學的亞歷山德拉?烏爾曼(Aleksandra Urman)指出,“而這種標注方式存在幾個問題。”任何由 AI 完成標注的結果都必須經過人類的檢查和驗證,烏爾曼擔心,研究人員在這一步驟上做得不夠到位。Loq28資訊網——每日最新資訊28at.com

此外,烏爾曼對研究中用于驗證少量人工標注答案與 AI 標注答案一致性的統計方法也提出了質疑。她表示,研究中使用的皮爾遜相關系數(Pearson correlation)“非常不標準,且存在特殊性”。Loq28資訊網——每日最新資訊28at.com

盡管人們對研究結果的有效性存在爭議,但西蒙認為,仍需開展更多工作,以確保用戶能正確理解這些工具給出的答案。“提高 AI 生成答案的準確性、多樣性和信息來源可靠性十分必要,尤其是在這些系統正更廣泛地應用于各個領域的背景下,”他說。Loq28資訊網——每日最新資訊28at.com

本文鏈接:http://www.rrqrq.com/showinfo-45-27699-0.html研究顯示生成式 AI 工具答案質量堪憂:三分之一缺乏可靠來源支持

聲明:本網頁內容旨在傳播知識,若有侵權等問題請及時與本網聯系,我們將在第一時間刪除處理。郵件:2376512515@qq.com

上一篇: 英偉達 CEO 黃仁勛談 AI 工具個人使用體驗:視其為“思考伙伴”,日常混用多個系統

下一篇: OpenAI 奧爾特曼爆料:GPT-5 重構一切,一人頂五個團隊

標簽:
  • 熱門焦點
  • 10億基金,李彥宏呼喚下一個AI獨角獸

    ©?深響原創 · 作者|何文 AI太熱了。 在海外,OpenAI估值已超270億美元、英偉達市值破萬億、微軟把GPT整合進了全線產品。在國內,百度、阿里、華為、商湯等大公司,以及
  • 冰墩墩NFT遇冷,價格跌80%,日成交僅3筆。

    “兩日上漲千倍”并不存在,且冰墩墩NFT的市場熱度遠不及社交媒體所稱的那樣高。2月11日,獲得國際奧委會授權的2022冬奧會吉祥物冰墩墩相關NFT產品在nWayPlay上線
  • 元宇宙時代NFT的價值衡量

    有人認為NFT的高昂價格只是炒作的產物,并不具有其對等的價值,但其實NFT并不是空中樓閣,只是區塊鏈數字分類賬中的一種形式。誠然,目前的NFT仍處于灰色地帶,相關的法
  • 用戶可以把自己的醫療健康數據做成NFT出售給醫藥公司掙錢

    你可能聽說過不可偽造的代幣,或NFTs。NFTs是數字代幣,代表完全獨特的項目的所有權;存儲在區塊鏈中并可追蹤,它們不能被修改、替換或復制。作為NFT鑄造的資產在數字
  • 這個好萊塢影視制作公司涉足NFT,讓持有者在制作中發揮作用

    前米高梅首席執行官Roger Birnbaum和AOL的接班人Mark Kimsey成立了一個新的好萊塢工作室,提供 NFT,讓持有者在制作中發揮作用Electromagnetic Productions 創始
  • 以太坊面臨來自Fantom的巨大挑戰

    眾所周知,區塊鏈和加密貨幣項目經常因其對環境的影響而受到批評。但是有一個非營利性的加密貨幣和區塊鏈項目說它比其他的更環保。今天老雅痞就給大家聊一聊加
  • Meta 呼吁行業合作建立元宇宙網絡基礎設施

    Facebook 的母公司 Meta呼吁,建立必要的全球合作的基礎設施,以支持其蓬勃發展的元宇宙野心。“元宇宙”成為 2021 年的主要流行語之一,這在很大程度上是由 Facebo
  • Staking 收益翻倍?

    以太坊質押可能很快就會有兩倍的利潤。Coinbase 估計,在 1 月份以太坊網絡合并后,持有 ETH 的回報將翻倍。增長預期假設來自加密貨幣交易所 Coinbase 的估計是準
  • 元宇宙專題二:GameFi 深度解析,元宇宙內容雛形顯現

    GameFi=Game(游戲)+DEFI(去中心化金融),核心特點為“Play to Earn”。通過技術與去中心化價值觀賦能,GameFi 游戲資產化身為NFT 和代幣上鏈,具備了可驗證性和流通性;開
Top 国产精品嫩草99av在线_一区在线视频观看_欧美高清一区_欧美 日韩 国产 一区_99精品欧美一区二区三区_久久大香伊蕉在人线观看热2_一色屋精品视频在线观看网站_在线亚洲国产精品网站_亚洲区一区二区三区_你懂的视频一区二区
在线看国产一区二区| www.66久久| 在线观看免费亚洲| 蜜乳av一区二区三区| 国产拍揄自揄精品视频麻豆| 极品中文字幕一区| 午夜精品在线看| 久久久久久99久久久精品网站| 欧美va日韩va| 中文字幕va一区二区三区| 中文字幕不卡的av| 91毛片在线观看| 亚洲精品国产a久久久久久| 麻豆精品网站| 视频一区中文字幕| 久久综合精品国产一区二区三区| 伊人成人在线| 国内精品国产成人| 精品国产自在久精品国产| 国产在线麻豆精品观看| 另类小说图片综合网| 欧美激情一区二区三区在线视频| 一本久道久久综合婷婷鲸鱼| 日韩亚洲国产中文字幕欧美| 亚洲一区二区视频在线| 成人av手机在线观看| 色婷婷久久久亚洲一区二区三区| 国产欧美视频一区二区三区| 久久精品国产网站| 91视频免费观看| www.性欧美| 日韩精品专区在线影院重磅| 美腿丝袜亚洲综合| 欧美色图在线观看| 首页国产欧美久久| 欧美日韩精品一区二区在线播放| 日本vs亚洲vs韩国一区三区| 久久99九九99精品| 久久一区二区三区四区| 欧美日韩亚洲丝袜制服| 精品粉嫩超白一线天av| 舔着乳尖日韩一区| 91小视频在线免费看| 久久国产夜色精品鲁鲁99| 日本在线不卡视频一二三区| 欧美另类视频在线| 日韩免费观看高清完整版| 日韩av中文字幕一区二区| 91久久精品国产91久久性色tv| 欧美tickling网站挠脚心| 国产一区二区三区四区五区入口 | 欧美淫片网站| 日韩精品一区二区三区中文精品| 蜜桃视频在线观看一区| 久久久久se| 首页国产欧美久久| 久久福利毛片| 亚洲成人综合在线| 亚洲一区黄色| 亚洲.国产.中文慕字在线| 一区二区三区精品国产| 亚洲女人的天堂| 国产偷国产偷亚洲高清97cao| 成人免费在线视频观看| 伊人久久大香线蕉av超碰演员| 中文字幕亚洲电影| 亚洲欧洲日韩综合二区| 悠悠色在线精品| 午夜一区二区三区不卡视频| 亚洲国产成人av网| 久久午夜精品| 激情伊人五月天久久综合| 欧美日韩在线直播| 国产成人免费9x9x人网站视频| 日韩视频免费观看高清完整版| 丁香六月久久综合狠狠色| 精品国产乱码久久久久久夜甘婷婷 | 亚洲午夜在线| 99re热这里只有精品免费视频 | 欧美本精品男人aⅴ天堂| 石原莉奈一区二区三区在线观看| 国内精品福利| 国产日韩欧美电影| www.性欧美| 91精品国产综合久久精品图片| 日日摸夜夜添夜夜添国产精品| 欧美日韩亚洲免费| 国产亚洲精品久| a级精品国产片在线观看| 欧美久久高跟鞋激| 日本免费新一区视频| 久久久久久久久一区二区| 亚洲综合在线电影| 在线观看视频免费一区二区三区| 久久亚洲精华国产精华液 | 99香蕉国产精品偷在线观看 | 国产成人免费av在线| 欧美日韩精品一区视频| 精品亚洲免费视频| 久久久成人网| 日韩国产精品久久| 在线观看亚洲成人| 极品美女销魂一区二区三区| 91国偷自产一区二区三区观看| 无码av中文一区二区三区桃花岛| 国产亚洲网站| 亚洲一二三区视频在线观看| 亚洲一区日韩在线| 婷婷六月综合亚洲| 日本丶国产丶欧美色综合| 日韩精品欧美精品| 欧美日韩精品免费| 粉嫩欧美一区二区三区高清影视| 欧美一卡2卡三卡4卡5免费| 国产精品538一区二区在线| 欧美一级理论性理论a| 99久久精品免费看国产免费软件| 久久久久国产免费免费 | 欧美一区二区三区色| 97精品久久久午夜一区二区三区 | 国产精品麻豆网站| 99视频国产精品免费观看| 午夜视频一区二区| 欧美日韩一区高清| av不卡在线观看| 国产精品久久久久久久久免费相片| 狠狠入ady亚洲精品经典电影| 亚洲制服丝袜av| 欧洲av一区二区嗯嗯嗯啊| 国产成人自拍在线| 国产精品久久久久久久久免费樱桃| 亚洲美女色禁图| 美女一区二区在线观看| 日韩免费观看2025年上映的电影| 欧美日韩免费观看一区=区三区 | 国产精品vip| 午夜亚洲国产au精品一区二区| 欧美图区在线视频| 欧美一区激情| 日韩电影在线免费看| 精品久久五月天| 9国产精品视频| 精品一区免费av| 中文一区二区在线观看 | 日韩高清国产一区在线| 精品成a人在线观看| 香蕉视频成人在线观看 | 欧美大片一区二区三区| 99亚洲一区二区| 福利一区二区在线| 亚洲欧美日韩国产另类专区| 欧美日韩国产一级| 国户精品久久久久久久久久久不卡| 天堂va蜜桃一区二区三区 | 亚洲一级片在线观看| 精品少妇一区二区三区在线播放 | 欧美激情艳妇裸体舞| 91久久久免费一区二区| 欧美精品国产| 韩国精品在线观看| 亚洲精品视频在线观看免费| 欧美一级黄色录像| 麻豆精品网站| 欧美午夜精品久久久久免费视| 日本不卡1234视频| 亚洲蜜桃精久久久久久久| 欧美一区二区高清| 麻豆久久久9性大片| 伊人久久av导航| 99re热视频这里只精品| 麻豆精品新av中文字幕| 曰韩精品一区二区| 国产无人区一区二区三区| 欧美精品aⅴ在线视频| 国产精品推荐精品| 国语自产精品视频在线看抢先版结局| 看片网站欧美日韩| 午夜久久久久久久久久一区二区| 久久久高清一区二区三区| 欧美精品久久久久久久多人混战| 国产偷久久久精品专区| 欧美日韩在线精品一区二区三区| 国产一区二区按摩在线观看| 日韩精品一二区| 亚洲综合小说图片| 国产精品狼人久久影院观看方式| 日韩一区二区高清| 欧美三级电影一区| 欧美性欧美巨大黑白大战| 日韩亚洲一区在线播放| 欧美日韩一区二区高清| 91视频一区二区三区| 99久久精品国产一区| 国产999精品久久久久久绿帽| 韩国成人精品a∨在线观看| 日韩精品一区第一页| 亚洲韩国一区二区三区| 亚洲精品一二三四区| 亚洲黄色小视频| 樱桃国产成人精品视频|