国产精品嫩草99av在线_一区在线视频观看_欧美高清一区_欧美 日韩 国产 一区_99精品欧美一区二区三区_久久大香伊蕉在人线观看热2_一色屋精品视频在线观看网站_在线亚洲国产精品网站_亚洲区一区二区三区_你懂的视频一区二区

當前位置:首頁 > 元宇宙 > AI

整合海量公共數據,谷歌開源 AI 統計學專家 DataGemma

來源: 責編: 時間:2024-10-06 09:27:05 164觀看
導讀 準確的統計數據、時效性強的信息,一直是大語言模型產生幻覺的重災區。知識是現成的,但學是不可能學的。并非此身惰怠,只因現實太多阻礙。對于這個問題,谷歌在近日推出了自己籌劃已久的大型數據庫 Data Commons,以

準確的統計數據、時效性強的信息,一直是大語言模型產生幻覺的重災區。1FT28資訊網——每日最新資訊28at.com

知識是現成的,但學是不可能學的。并非此身惰怠,只因現實太多阻礙。1FT28資訊網——每日最新資訊28at.com

對于這個問題,谷歌在近日推出了自己籌劃已久的大型數據庫 Data Commons,以及在此基礎上誕生的大模型 DataGemma。1FT28資訊網——每日最新資訊28at.com

1FT28資訊網——每日最新資訊28at.com

論文地址:https://docs.datacommons.org/papers/DataGemma-FullPaper.pdf1FT28資訊網——每日最新資訊28at.com

Data Commons 是一個龐大的開源公共統計數據存儲庫,包含來自聯合國(UN)、疾病控制與預防中心(CDC)、人口普查局、衛生部、環境機構、經濟部門、非政府組織和學術機構等可信來源的大量統計數據。1FT28資訊網——每日最新資訊28at.com

目前,整個語料庫包含超過 2500 億個數據點和超過 2.5 萬億個三元組。1FT28資訊網——每日最新資訊28at.com

1FT28資訊網——每日最新資訊28at.com

數據有了,模型要怎么處理?本文提出了一種將 LLM 橋接到數據的通用架構,并探討了需要解決的三個問題。1FT28資訊網——每日最新資訊28at.com

首先,LLM 必須學會在適當的時機選擇,是使用存儲在模型參數中的知識,還是從外部獲取信息。1FT28資訊網——每日最新資訊28at.com

當然了,關于何時查詢外部源這件事,需要 LLM 學到自己的參數里,這可以采用多種機制來實現。1FT28資訊網——每日最新資訊28at.com

1FT28資訊網——每日最新資訊28at.com

其次,需要決定應該從哪個外部源查詢所需的信息,因為可用的信息源可能很多而且是動態的。在本文中,作者直接使用單一外部信息源來包含大量數據源。1FT28資訊網——每日最新資訊28at.com

最后,一旦明確了需要哪些外部數據,LLM 就需要生成一個或多個查詢來獲取這些數據。1FT28資訊網——每日最新資訊28at.com

一般來說,不同的來源會產生不同類型的數據,如果 LLM 還要專門去學習各種 API 就有點麻煩了。因此,作者開發了用于外部數據和服務的單一通用 API。1FT28資訊網——每日最新資訊28at.com

1FT28資訊網——每日最新資訊28at.com

API 的靈感來自于 Robert McCool 在 1993 年設計的 URL 參數編碼接口,雖然簡單,卻經受住了時間的考驗,是目前在網絡上最接近通用 API 的接口。1FT28資訊網——每日最新資訊28at.com

作者使用自然語言來表達查詢,返回的答案可以用 mime-type 來增強,以允許非文本答案。1FT28資訊網——每日最新資訊28at.com

搞定了這些,一個能夠充分利用最新最全外部數據的「AI 統計學家」(或者叫統計學魔術師)就誕生了。1FT28資訊網——每日最新資訊28at.com

1FT28資訊網——每日最新資訊28at.com

DataGemma

對于 Data Commons 這么龐大的數據源,想要被 LLM 正常使用,需要面對一些現實的挑戰:1FT28資訊網——每日最新資訊28at.com

1. 與統計事實相關的用戶查詢可能涉及一系列邏輯、算術或比較運算。1FT28資訊網——每日最新資訊28at.com

比如「世界上排名前 5 的二氧化碳排放國是哪些國家?」;更復雜一點的比如「加利福尼亞州是世界上最大的經濟體嗎?」(這里面暗含了所比較的實體 —— 加利福尼亞州與其他國家 / 地區相比,而不是美國各州);或者「煤發電量高的美國各州,慢性阻塞性肺病發病率也很高嗎?」(這涉及到實體和指標之間的比較)。1FT28資訊網——每日最新資訊28at.com

2. 公共統計數據包含多種模式和格式,通常需要相當多的背景上下文才能正確解釋。1FT28資訊網——每日最新資訊28at.com

之前的工作利用了兩種方法來緩解這些問題:使用工具和檢索增強生成(RAG)。1FT28資訊網——每日最新資訊28at.com

前一種方法會調整 LLM 來生成一種標記語言,能夠將自然文本與對外部工具的函數調用穿插在一起。為了對抗幻覺,工具可能會查詢數據庫或搜索引擎。1FT28資訊網——每日最新資訊28at.com

而在 RAG 中,輔助檢索系統從大型語料庫中識別與用戶查詢相關的背景知識,然后用這些知識來增強用戶的查詢。1FT28資訊網——每日最新資訊28at.com

本文作者以谷歌開源的 Gemma 和 Gemma-2 模型為基礎,分別利用檢索交錯生成(RIG)和 RAG 微調出兩個新的版本。1FT28資訊網——每日最新資訊28at.com

1FT28資訊網——每日最新資訊28at.com

開源模型:https://huggingface.co/collections/google/datagemma-release-66df7636084d2b150a4e66431FT28資訊網——每日最新資訊28at.com

數據共享

Data Commons 的數據共享涉及兩項創新。1FT28資訊網——每日最新資訊28at.com

首先,研究人員花了數年時間訪問大量公開可用的數據集,追蹤數據背后的假設,并使用 Schema.org(一種用于編碼結構化數據的開放詞匯表)對它們進行規范化,最終形成了一個包含所有數據的通用知識圖譜。1FT28資訊網——每日最新資訊28at.com

1FT28資訊網——每日最新資訊28at.com

其次,研究人員使用 LLM 創建一個自然語言界面,允許用戶用通用語言提出問題,并通過圖表等方式來探索龐大的數據庫。1FT28資訊網——每日最新資訊28at.com

需要明確的是,LLM 只是將查詢轉換為 Data Commons 中的詞匯表,不會與底層數據交互,也不會生成輸出,因此不必擔心出現幻覺之類的問題。1FT28資訊網——每日最新資訊28at.com

當前的方法是利用這個自然語言接口,教導 LLM 何時以及如何與 Data Commons 的接口進行通信。1FT28資訊網——每日最新資訊28at.com

對齊方面,作者采用 LIMA(一種指令調整和強化學習方法),遵循少即是多的原則,利用數量少但質量很高的一組示例,使最終任務與用戶偏好保持一致。1FT28資訊網——每日最新資訊28at.com

RIG 與 RAG

接下來介紹將 LLM 與 Data Commons 連接的兩種不同方法:1FT28資訊網——每日最新資訊28at.com

RIG1FT28資訊網——每日最新資訊28at.com

檢索交錯生成 (RIG),是一種受使用工具啟發的方法,將 LLM 進行微調以生成自然語言數據共享查詢,然后,多模型管道將此查詢轉換為結構化數據查詢,用于從 Data Commons 數據庫檢索答案。1FT28資訊網——每日最新資訊28at.com

1FT28資訊網——每日最新資訊28at.com

如上圖所示,這里擴展了 RIG 管道的步驟。首先是經過微調以生成自然語言查詢的模型;接著是后處理器,將自然語言查詢轉換為結構化數據查詢;最后一個組件是查詢機制,從 Data Commons 檢索統計答案并使用 LLM 生成。1FT28資訊網——每日最新資訊28at.com

當向 LLM 提出統計查詢時,通常會生成包含數字答案的文本(如下圖所示)。這時可以根據數字(LLM-SV)相關的上下文,在 Data Commons 數據庫中匹配最相關的值(DC-SV),作為事實檢查機制一起返回給用戶。1FT28資訊網——每日最新資訊28at.com

1FT28資訊網——每日最新資訊28at.com

研究人員選擇了大約 700 個用戶查詢(對應不同的統計問題)。1FT28資訊網——每日最新資訊28at.com

對于每個問題,都會從基本模型中選擇帶有統計數據的答案(約 400 個),然后將這些響應提供給功能更強大的 LLM(Gemini 1.5 Pro),指示它圍繞統計數據點引入自然語言數據共享調用。1FT28資訊網——每日最新資訊28at.com

所使用的提示包含三個示例作為指導,要求注釋出統計值和單位,還要指示數據共享調用包括地名、指標和日期等。最后會進行人工審查,并手動重寫不符合要求的數據共享調用。1FT28資訊網——每日最新資訊28at.com

1FT28資訊網——每日最新資訊28at.com

為了評估單個測試查詢響應,這里需要子字符串級別的詳細反饋。研究人員采用了上圖所示的可視化工具。1FT28資訊網——每日最新資訊28at.com

人工評估人員能夠瀏覽所有查詢,并檢查每個查詢響應中的所有 Data Commons 調用,首先快速檢查是否存在任何明顯的事實不準確之處,然后對響應中存在的每項統計數據進行評估。1FT28資訊網——每日最新資訊28at.com

1FT28資訊網——每日最新資訊28at.com

上表顯示了 RIG 方法的事實準確性指標(Data Commons 中的統計數據與 101 個查詢中的 LLM 響應進行比較的情況)??傮w而言,RIG 方法提高了真實性,從 5-17% 提高到約 58%。1FT28資訊網——每日最新資訊28at.com

RAG1FT28資訊網——每日最新資訊28at.com

RAG 管道同樣包含多個組件。首先,用戶查詢被傳遞到一個小型的、經過微調的 LLM,它會生成與用戶查詢相關的自然語言查詢;然后,通過 Data Commons 的自然語言接口來獲取相關的表;最后,將原始用戶查詢和檢索到的表交給長上下文 LLM(Gemini 1.5 Pro)。1FT28資訊網——每日最新資訊28at.com

原始用戶查詢以及結果表可能會相當長。例如,比較查詢可能包括來自美國所有 50 個州或全球 194 個國家的多個表的多年數據。1FT28資訊網——每日最新資訊28at.com

1FT28資訊網——每日最新資訊28at.com

在綜合查詢集中,平均輸入長度為 38,000 個 token,最大輸入長度為 348,000 個 token。由于輸入量很大,因此必須使用長上下文 LLM,用戶響應如上圖所示。1FT28資訊網——每日最新資訊28at.com

1FT28資訊網——每日最新資訊28at.com

對于 RAG 方法,人類評估者評估 LLM 生成的細粒度問題及其相應的數據共享響應的質量。首先驗證是否生成了足夠且相關的問題來解決用戶查詢(上圖);然后評估每個單獨問題的質量及其相應的數據共享響應(下圖)。1FT28資訊網——每日最新資訊28at.com

1FT28資訊網——每日最新資訊28at.com

下表的結果表明,LLM 在引用數字時通常是準確的 (99%),當根據這些說法進行推論時,準確性會下降,在 6-20% 的時間內得出錯誤的推論。1FT28資訊網——每日最新資訊28at.com

1FT28資訊網——每日最新資訊28at.com

參考資料:1FT28資訊網——每日最新資訊28at.com

https://venturebeat.com/ai/datagemma-googles-open-ai-models-mitigate-hallucination-on-statistical-queries/1FT28資訊網——每日最新資訊28at.com

本文鏈接:http://www.rrqrq.com/showinfo-45-8033-0.html整合海量公共數據,谷歌開源 AI 統計學專家 DataGemma

聲明:本網頁內容旨在傳播知識,若有侵權等問題請及時與本網聯系,我們將在第一時間刪除處理。郵件:[email protected]

上一篇: macOS 原生版 Perplexity 本月 15 日上線:AI 顛覆搜索體驗,重塑蘋果 Mac 用戶知識管理

下一篇: OpenAI 推出全新寫作、編碼工具 ChatGPT Canvas,將免費開放

標簽:
  • 熱門焦點
Top 国产精品嫩草99av在线_一区在线视频观看_欧美高清一区_欧美 日韩 国产 一区_99精品欧美一区二区三区_久久大香伊蕉在人线观看热2_一色屋精品视频在线观看网站_在线亚洲国产精品网站_亚洲区一区二区三区_你懂的视频一区二区
欧美一级黄色片| 国产成人自拍在线| 亚洲精品免费视频| 亚洲日本在线a| 亚洲欧美日韩国产手机在线| 一区在线播放视频| 亚洲老妇xxxxxx| 午夜在线成人av| 蜜桃av一区二区| 国内精品写真在线观看| 国产成人在线免费观看| 国产大陆亚洲精品国产| 不卡影院免费观看| 欧美日韩精品免费观看| 亚洲电影自拍| 色婷婷av久久久久久久| 欧美日韩中文精品| 精品国产三级电影在线观看| 国产午夜精品美女毛片视频| 综合亚洲深深色噜噜狠狠网站| 亚洲精品成人在线| 欧美a级理论片| 粉嫩13p一区二区三区| 午夜电影亚洲| 久久国产精品久久精品国产| 欧美亚洲另类激情小说| 精品国产一区二区三区av性色| 中文乱码免费一区二区| 首页国产丝袜综合| 国产91在线观看| 影音先锋久久| 色噜噜狠狠色综合中国| 精品国产一区二区三区忘忧草| 国产精品国产a| 奇米一区二区三区av| 99久久久免费精品国产一区二区| 激情久久五月| 欧美三区在线观看| 久久这里只精品最新地址| 一区二区成人在线观看| 国产精品一线二线三线| 国产精品二区影院| 欧美色精品在线视频| 欧美激情一区二区三区不卡| 午夜伦理一区二区| 成人三级在线视频| 亚洲一区二区三区高清| 精品国产一区二区三区久久久蜜月| 亚洲欧美日韩中文播放 | 国产日韩综合av| 亚洲成人福利片| 波多野结衣一区二区三区| 亚洲专区一区二区三区| 精品成人免费观看| 手机精品视频在线观看| 欧美一区二区三区四区夜夜大片| 久久亚洲色图| 国产精品视频看| 国产精品18久久久久久久久久久久 | 国产精品久久久久三级| 国产在线精品一区在线观看麻豆| 国产精品分类| 欧美电影免费观看高清完整版在线 | 亚洲三级电影在线观看| 欧美变态tickling挠脚心| 亚洲成人免费影院| 91免费版在线| 日韩欧美中文一区二区| 日日噜噜夜夜狠狠视频欧美人 | 很黄很黄激情成人| 精品国产百合女同互慰| 奇米777欧美一区二区| 91久久精品一区二区别| 26uuu久久综合| 精彩视频一区二区三区| 国产精品一级久久久| 国产精品青草综合久久久久99| 国产精品夜夜嗨| 欧美性色综合网| 亚洲二区视频在线| 亚洲人久久久| 国产精品久久久久一区| 欧美aⅴ99久久黑人专区| 日韩欧美精品在线视频| 国产一区二区三区日韩| 欧美午夜视频网站| 日韩av网站在线观看| 国产九区一区在线| 亚洲精品免费播放| 亚洲国产精品第一区二区三区| 日本一区二区三级电影在线观看 | 日本丰满少妇一区二区三区| 亚洲午夜免费电影| 99re66热这里只有精品4| 成人欧美一区二区三区在线播放| 色综合欧美在线| 国产女人aaa级久久久级| proumb性欧美在线观看| 欧美成人精品二区三区99精品| 国产精品一区二区视频| 欧美福利电影网| 国产一区二区美女诱惑| 欧美一区二区三区四区视频| 国产成人精品免费| 欧美成人福利视频| 97久久精品人人爽人人爽蜜臀 | 美国欧美日韩国产在线播放| 一区二区在线电影| 亚洲一区二区三区高清| 国产精品尤物| 中文字幕一区在线观看视频| 欧美久久99| 成人欧美一区二区三区1314| 亚洲欧洲一区二区天堂久久| 亚洲综合视频在线观看| 久久亚洲图片| 国产精品一区二区三区乱码| 精品伦理精品一区| 国产精品av久久久久久麻豆网| 亚洲色图另类专区| 久久精品国产第一区二区三区最新章节| 亚洲一区二区精品久久av| 欧洲一区二区av| 懂色av噜噜一区二区三区av| 国产日韩欧美精品在线| 国产精品毛片一区二区三区| 日本免费新一区视频| 欧美大尺度电影在线| 极品少妇一区二区三区| 日韩精品亚洲一区| 精品国免费一区二区三区| 影音先锋久久资源网| 日本不卡一二三区黄网| 精品久久久久一区二区国产| 日韩午夜视频在线观看| 另类中文字幕网| 亚洲精品一区二区三区影院| 亚洲精品系列| 国产在线一区二区综合免费视频| 国产亚洲精品久| 色一区在线观看| 99re热这里只有精品免费视频| 一区二区三区四区国产精品| 欧美欧美欧美欧美| 国产精品久久| 韩国精品一区二区| 国产精品久久久久久久久久久免费看| 久久久久网站| 欧美日韩精品一本二本三本| 男女视频一区二区| 欧美激情中文不卡| 欧美日本在线观看| 亚洲激情精品| 成人亚洲一区二区一| 婷婷激情综合网| 国产女人18水真多18精品一级做| 色噜噜狠狠成人中文综合| 欧美精品一区二区三区在线看午夜| 日韩精品三区四区| 1024成人网| 精品久久99ma| 精品视频在线免费| 国产亚洲综合精品| 91免费视频观看| 国产麻豆精品95视频| 午夜国产不卡在线观看视频| 国产日韩高清在线| 欧美一区二区免费视频| 先锋影音国产精品| 韩日午夜在线资源一区二区| 国产99精品国产| 久久福利资源站| 午夜精品福利在线| 中文字幕一区二| 久久久精品黄色| 91麻豆精品久久久久蜜臀| 色老汉一区二区三区| 日韩视频一区二区三区在线播放免费观看| 国产精品中文字幕一区二区三区| 亚洲国产精品自拍| 成人欧美一区二区三区白人| 欧美精彩视频一区二区三区| 日韩欧美国产三级| 欧美一区二区三区免费视频| 在线这里只有精品| 亚洲一区二区三区涩| 日韩视频在线一区二区三区| 欧美日韩亚洲一区二区三区在线观看 | 国产酒店精品激情| 欧美1区免费| 粉嫩欧美一区二区三区高清影视| 麻豆免费看一区二区三区| 午夜精品一区二区三区免费视频| 亚洲欧美在线aaa| 中文字幕在线一区免费| 欧美经典一区二区| 国产亚洲精品7777| 国产精品三级视频| 亚洲国产高清aⅴ视频| 中文字幕+乱码+中文字幕一区|