国产精品嫩草99av在线_一区在线视频观看_欧美高清一区_欧美 日韩 国产 一区_99精品欧美一区二区三区_久久大香伊蕉在人线观看热2_一色屋精品视频在线观看网站_在线亚洲国产精品网站_亚洲区一区二区三区_你懂的视频一区二区

當前位置:首頁 > 元宇宙 > AI

院士領銜推出大模型的第 3 種記憶:比參數存儲和 RAG 都便宜,2.4B 模型越級打 13B

來源: 責編: 時間:2024-07-11 17:26:17 240觀看
導讀 給大模型加上第三種記憶格式,把寶貴的參數從死記硬背知識中解放出來!中科院院士鄂維南領銜,上海算法創新研究院等團隊推出 Memory3,比在參數中存儲知識以及 RAG 成本都更低,同時保持比 RAG 更高的解碼速度。在實驗

給大模型加上第三種記憶格式,把寶貴的參數從死記硬背知識中解放出來!YKC28資訊網——每日最新資訊28at.com

中科院院士鄂維南領銜,上海算法創新研究院等團隊推出 Memory3,比在參數中存儲知識以及 RAG 成本都更低,同時保持比 RAG 更高的解碼速度。YKC28資訊網——每日最新資訊28at.com

YKC28資訊網——每日最新資訊28at.com

在實驗中,僅有 2.4B 參數的 Memory3 模型不僅打敗了許多 7B-13B 的模型,在專業領域任務如醫學上的表現也超過了傳統的 RAG 方法,同時推理速度更快,“幻覺”問題也更少。YKC28資訊網——每日最新資訊28at.com

YKC28資訊網——每日最新資訊28at.com

目前相關論文已上傳到 arXiv,并引起學術界關注。YKC28資訊網——每日最新資訊28at.com

YKC28資訊網——每日最新資訊28at.com

知識按使用頻率分類

這一方法受人腦記憶原理啟發,獨立于存儲在模型參數中的隱性知識和推理時的短期工作工作記憶,給大模型添加了顯式記憶。YKC28資訊網——每日最新資訊28at.com

具體來說,人類的記憶大致可以分為三部分:YKC28資訊網——每日最新資訊28at.com

顯式記憶:可以主動回憶的長期記憶,比如讀過的文章。獲取顯式記憶很容易,但提取時需要一定的回憶過程。YKC28資訊網——每日最新資訊28at.com

隱式記憶:無意識使用的長期記憶,比如騎自行車的技能。獲取隱式記憶需要大量重復練習,但使用時毫不費力。YKC28資訊網——每日最新資訊28at.com

外部信息:存在大腦之外的信息,如考試時的備考資料。獲取和使用都很輕松,但遇到新問題時作用有限。YKC28資訊網——每日最新資訊28at.com

可以看出,三種記憶形式在獲取和使用的效率上形成了鮮明的互補。人腦會根據知識的使用頻率,巧妙地在它們之間分配存儲位置,從而最小化整體開銷。YKC28資訊網——每日最新資訊28at.com

反觀大模型,目前主要依賴在參數中以隱式記憶的形式來存儲知識,這導致兩個問題:YKC28資訊網——每日最新資訊28at.com

知識分配效率低:無論一個知識使用得多頻繁,都一視同仁塞進參數里,導致大量冷知識占用了寶貴的參數空間。YKC28資訊網——每日最新資訊28at.com

知識提取效率低:每次使用知識,都得動用大量參數參與計算。YKC28資訊網——每日最新資訊28at.com

目前在訓練階段,團隊將大模型比作顯式記憶能力受損的患者,靠學習如何系鞋帶一樣的大量重復練習才能背下一點知識,消耗大量的數據和能量。YKC28資訊網——每日最新資訊28at.com

在推理階段,大模型又好像一個人每寫一個單詞時都要回憶起畢生所學的一切,就很不合理。YKC28資訊網——每日最新資訊28at.com

基于以上思路,團隊按照知識的預期使用頻率(橫軸)計算了讀寫成本(縱軸),陰影區域表示給定記憶格式的最小成本區域。YKC28資訊網——每日最新資訊28at.com

結果發現,把常用知識塞進模型參數里成本最低,但容量有限;不常用的知識直接檢索效率最高,但每次讀取都要重新編碼,成本高;而顯式記憶則是個平衡點,對于使用次數中等的大部分知識最劃算。YKC28資訊網——每日最新資訊28at.com

YKC28資訊網——每日最新資訊28at.com

記憶電路理論

團隊進一步在論文中提記憶電路理論,在大模型語境下重新定義知識和記憶,以確定哪些知識更適合存儲為顯式記憶,以及什么樣的模型架構適合讀寫顯式記憶。YKC28資訊網——每日最新資訊28at.com

YKC28資訊網——每日最新資訊28at.com

通過分析一些已知的大模型內部機制,如事實問答、搜索復制粘貼等,團隊認為大模型中的每條知識都可以表示為一個輸入-輸出關系,加上實現這個關系的內部電路(circuit)。YKC28資訊網——每日最新資訊28at.com

電路指計算圖中的一個子圖,由一些注意力頭和 MLP 神經元組成,這些電路的輸入輸出具有一定的語義關聯。大模型的知識可進一步分為兩類:YKC28資訊網——每日最新資訊28at.com

具體知識(specific knowledge):電路的輸入和輸出都具有明確的語義,如常識、常見短語等。YKC28資訊網——每日最新資訊28at.com

抽象知識(abstract knowledge):電路的輸出語義可變,如搜索、復制、粘貼,需要通過輸入推理出輸出。YKC28資訊網——每日最新資訊28at.com

接下來,作者引入可分離知識(separable knowledge)的概念:如果一個知識可以僅通過文本實現而不必內置到模型參數里,那它就是可分離的。YKC28資訊網——每日最新資訊28at.com

可模仿知識(imitable knowledge)是可分離知識的一個特例,可以直接用描述這條知識自身的文本去“教會”另一個不具備這條知識的大模型,無需通過參數來編碼。YKC28資訊網——每日最新資訊28at.com

一個核心結論是,具體知識都是可模仿的,因此也是可分離的,都可轉化為顯式記憶。論文從理論上給出了(非形式化)證明。YKC28資訊網——每日最新資訊28at.com

YKC28資訊網——每日最新資訊28at.com

團隊進一步把具體知識按使用次數分成“無關緊要”、專業知識和常見短語三個等級,不同等級按照讀寫成本分別適合三種不同的記憶格式。YKC28資訊網——每日最新資訊28at.com

YKC28資訊網——每日最新資訊28at.com

擁有顯式記憶的大模型 Memory3

那么如何實現顯式記憶呢?YKC28資訊網——每日最新資訊28at.com

以注意力層的 key-value 向量作為顯式記憶的載體,在推理之前,Memory3 模型將所有引用文本轉換為顯式記憶,并將它們保存在硬盤或非易失性內存設備上。YKC28資訊網——每日最新資訊28at.com

在推理時,模型會查詢與當前上下文最相關的一些顯式記憶,將它們并入注意力機制中,與上下文的 key-value 向量一起計算注意力分數,生成下一個 token。YKC28資訊網——每日最新資訊28at.com

YKC28資訊網——每日最新資訊28at.com

然而,海量文本轉化成的顯式記憶不僅需要更多的磁盤空間,而且在推理過程中還會占用 GPU 內存,從而損害 LLM 生成的吞吐量。YKC28資訊網——每日最新資訊28at.com

為此,Memory3 采取了多維度壓縮優化策略:YKC28資訊網——每日最新資訊28at.com

layer 維度:只有前半部分的注意力層(記憶層)產生和存取顯式記憶,后半部分仍然是普通的注意力層。YKC28資訊網——每日最新資訊28at.com

head 維度:每層只有少部分 head(如 1/5)負責處理顯式記憶的 key-value,其他 head 保持原樣。YKC28資訊網——每日最新資訊28at.com

token 維度:對于每個 head,只選取參考文本中最相關的少量 token(如 8 個),提取其 key-value 作為顯式記憶。YKC28資訊網——每日最新資訊28at.com

最后再進一步用向量量化(vector quantization)壓縮每個 key 和 value 向量到更短的表示。YKC28資訊網——每日最新資訊28at.com

多級壓縮的組合,使得顯式記憶的規模從 45.9TB 壓縮到 4.02TB,壓縮到一個 GPU 集群通常配備的存儲容量之內。YKC28資訊網——每日最新資訊28at.com

另外,團隊在顯式記憶的讀寫上還有一些值得注意的細節設計:YKC28資訊網——每日最新資訊28at.com

推理時為了避免不同文本片段重復檢索顯式記憶,Memory3 每隔 64 個 token 做一次檢索,中間共享檢索結果。YKC28資訊網——每日最新資訊28at.com

頻繁調用顯式記憶會產生 IO 開銷。為此,Memory3 在內存中維護了一個固定大小的緩存,存儲最近訪問過的顯式記憶。YKC28資訊網——每日最新資訊28at.com

對于參考文本,模型使用不同的輸入符號(“<s>Reference:”)將其與普通文本區分開,避免干擾文本理解。YKC28資訊網——每日最新資訊28at.com

對于顯式記憶中的不同文本片段,模型為其分配了同一區間的位置編碼,保留局部上下文。這種”平行”位置編碼避免了長文本中間部分被忽略的問題。YKC28資訊網——每日最新資訊28at.com

最終訓練出來的 Memory3 模型,在 HuggingFace 排行榜上的評測結果如下,顯式記憶將平均分數提高了 2.51%。YKC28資訊網——每日最新資訊28at.com

相比之下 Llama2-7B 和 13B 之間的分數差異為 4.91%,而 13B 模型的非嵌入參數數量接近 7B 模型的兩倍。YKC28資訊網——每日最新資訊28at.com

因此,可以說顯式記憶可以將“有效模型大小”提高了 2.51/4.91≈51.1%。如果用 Qwen-1.8B 和 4B 來做參考,計算結果相似,“有效模型大小”提高 49.4%。YKC28資訊網——每日最新資訊28at.com

YKC28資訊網——每日最新資訊28at.com

在幻覺評估上,Memory3 避免了將文本壓縮到模型參數中可能會導致的信息丟失,表現的比大部分模型要好。YKC28資訊網——每日最新資訊28at.com

YKC28資訊網——每日最新資訊28at.com

論文中還詳細報告了從數據到訓練、微調和對齊過程的具體設置,感興趣的可以查看原文。YKC28資訊網——每日最新資訊28at.com

論文地址YKC28資訊網——每日最新資訊28at.com

https://arxiv.org/abs/2407.01178YKC28資訊網——每日最新資訊28at.com

參考鏈接YKC28資訊網——每日最新資訊28at.com

[1]https://x.com/rohanpaul_ai/status/1809782336021537094YKC28資訊網——每日最新資訊28at.com

本文來自微信公眾號:量子位(ID:QbitAI),作者:夢晨YKC28資訊網——每日最新資訊28at.com

本文鏈接:http://www.rrqrq.com/showinfo-45-5088-0.html院士領銜推出大模型的第 3 種記憶:比參數存儲和 RAG 都便宜,2.4B 模型越級打 13B

聲明:本網頁內容旨在傳播知識,若有侵權等問題請及時與本網聯系,我們將在第一時間刪除處理。郵件:[email protected]

上一篇: 古爾曼:蘋果首款支持 Apple Intelligence 的智能家居設備將是一款桌面機器人

下一篇: 中國開源操作系統 openKylin(開放麒麟)發布 AIPC 版本

標簽:
  • 熱門焦點
  • 《蜘蛛俠》火了,超級英雄就該這么演

    燃次元(ID:chaintruth)原創作者 | 陶 淘編輯 | 曹 拿下豆瓣8.8分、IMDB 9.1的高分,6月2日在全球同步上映的《蜘蛛俠:縱橫宇宙》(以下簡稱《蜘蛛俠》),上映不足一周,便在國內&ldquo;
  • 在元宇宙賣酸奶,這波聯動燃爆了!

    來源:品牌頭版 或許,每個人心中都住著一個小饞孩。可能是童年時百吃不厭,覺得新奇又有趣的跳跳糖;可能是味道香甜,咬下一口嘎嘣脆的扁桃仁;還有可能,是某種不知為什么,就是很愛吃的
  • 關于ChatGPT的10點思考

    作者:晏濤三壽近日ChatGPT又有大動作。5月19日,OpenAI在官網宣布正式發布App應用,并登錄蘋果應用商店。與網頁版的聊天機器人相比,iOS應用程序的發布有望讓更多人接觸到ChatGPT
  • 元宇宙這一年:技術加速落地,助傳統行業走向新階段

    美國當地時間1月8日,2023年CES(消費電子展覽會)完美落幕。而在這項一年一度的科技圈盛事中,元宇宙仍是主角和焦點之一。 索尼在1月6日發布了備受關注的PS VR 2頭顯
  • 多地釋放積極信號,元宇宙正成為地方爭先競逐的主戰場?

    2月21日,2022中國·金魚嘴元宇宙生態賦能大會在南京建鄴區金魚嘴基金街區舉辦,南京建鄴區金魚嘴基金街區宣布計劃出資1億元,支持元宇宙行業發展。同時,會上發布了
  • 頂流IP“冰墩墩”帶著中國元素NFT進入全球視野

    一場被國際奧委會主席評價堪稱獨具匠心、非凡卓越的2022年北京冬季奧運會,在這個“雙奧之城”經歷了16個令人難忘的精彩日夜,最終圓滿閉幕。讓我們印象深刻的不
  • 紐約街頭出現NFT自動販賣機

    一家初創公司宣布在紐約市開放一臺NFT自動售貨機,允許任何人——即使是沒有加密資產的人也能購買NFT。該交易平臺名為Neon,上個月完成了一輪300萬美元的種子募捐
  • 融資千萬美元的元宇宙平臺UGC到底是什么?

    據獲悉,全球化元宇宙社交平臺BUD Technologies, Inc.(以下簡稱“BUD”)宣布完成1500萬美元A+輪融資,本輪融資由啟明創投領投,老股東源碼資本、GGV紀源資本、云九資
  • Staking 收益翻倍?

    以太坊質押可能很快就會有兩倍的利潤。Coinbase 估計,在 1 月份以太坊網絡合并后,持有 ETH 的回報將翻倍。增長預期假設來自加密貨幣交易所 Coinbase 的估計是準
Top 国产精品嫩草99av在线_一区在线视频观看_欧美高清一区_欧美 日韩 国产 一区_99精品欧美一区二区三区_久久大香伊蕉在人线观看热2_一色屋精品视频在线观看网站_在线亚洲国产精品网站_亚洲区一区二区三区_你懂的视频一区二区
91免费观看在线| 天天影视网天天综合色在线播放| 一区二区三区免费| 美女网站在线免费欧美精品| 99精品欧美一区| 午夜一级在线看亚洲| 日韩欧美在线网站| 洋洋成人永久网站入口| 懂色av一区二区三区蜜臀| 一区二区免费在线视频| 欧美一级高清片| 午夜精品视频一区| 欧美在线播放| 欧美久久久久久久久久| 亚洲精品中文在线影院| 国产精品亚洲一区二区三区在线| 亚洲黄色影片| 国产婷婷色一区二区三区| 美女视频一区在线观看| 亚洲天堂偷拍| 日韩精品最新网址| 天天做天天摸天天爽国产一区| 91浏览器在线视频| 欧美三级电影在线看| 国产日韩欧美激情| 美女www一区二区| 99成人免费视频| 久久精品亚洲乱码伦伦中文| 久久66热re国产| 久久亚洲精选| 一区二区免费在线播放| 欧美视频福利| 久久综合狠狠综合久久综合88 | 亚洲人成网站在线观看播放| 欧美电视剧在线观看完整版| 美女在线视频一区| 欧美亚洲在线| 亚洲激情图片小说视频| 99久久精品免费| 制服丝袜国产精品| 黄网站免费久久| 色婷婷久久久亚洲一区二区三区| 亚洲欧美日韩久久| 欧美日韩亚洲国产精品| 精品国产亚洲一区二区三区在线观看| 九九国产精品视频| 久久久久久久久久久一区| 一区二区三区加勒比av| 亚洲精品看片| 亚洲黄网站在线观看| 亚洲电影在线| 亚洲色欲色欲www在线观看| 91看片淫黄大片一级在线观看| 精品久久久久久综合日本欧美| 国产真实精品久久二三区| 欧美日韩精品一区二区天天拍小说| 日韩avvvv在线播放| 免播放器亚洲| 五月天激情小说综合| 久久午夜激情| 美女性感视频久久| 欧美日韩国产高清一区二区| 精品亚洲成a人| 欧美一区二区三区四区在线观看 | 欧美国产激情一区二区三区蜜月| 97精品电影院| 国产午夜精品久久久久久免费视| 99re这里只有精品6| 久久―日本道色综合久久| 色综合久久中文字幕综合网 | 亚洲综合电影一区二区三区| 午夜视频一区二区| 91国产精品成人| 免费成人你懂的| 5858s免费视频成人| 成人动漫av在线| 中文字幕不卡在线播放| 99热这里只有精品8| 丝瓜av网站精品一区二区| 欧美三级韩国三级日本一级| 国产成人午夜视频| 中文字幕成人av| 国产精品日韩二区| 另类专区欧美蜜桃臀第一页| 欧美一区二区三区精品| 欧美一区成人| 亚洲国产人成综合网站| 欧美人与禽zozo性伦| 99久久婷婷国产综合精品电影| 国产精品久久99| 久久综合狠狠| 国产成人精品免费在线| 国产精品久久久久aaaa| 久久久国产亚洲精品| 高清久久久久久| 亚洲欧美日韩久久| 欧美日韩国产综合久久| 色综合久久综合网欧美综合网 | 日韩一级高清毛片| 欧美日韩视频一区二区三区| 婷婷一区二区三区| 日韩免费成人网| 国产偷久久久精品专区| 国产精品66部| 一区二区三区资源| 91精品午夜视频| 亚洲激情综合| 国产成人免费在线视频| 一区二区三区免费| 欧美一级理论片| 亚洲一级在线| 97超碰欧美中文字幕| 天堂在线亚洲视频| 久久免费电影网| 欧美亚洲综合色| 亚洲成人直播| 国产成人av一区二区| 亚洲一区二区偷拍精品| 精品国产乱码久久久久久1区2区| 国产乱人伦精品一区二区| 91在线免费播放| 国产综合色精品一区二区三区| 国产精品久久久久久久久动漫 | 伊人精品在线| 福利一区福利二区| 视频一区二区三区入口| 久久精品日产第一区二区三区高清版| 日本高清成人免费播放| 亚洲高清视频在线观看| 懂色av一区二区三区蜜臀| 日韩av在线免费观看不卡| 国产精品三级av在线播放| 日韩一区二区三区四区| 91激情在线视频| 99riav国产精品| 欧美黄色一区| 成人视屏免费看| 老司机一区二区| 亚洲第一福利一区| 亚洲手机成人高清视频| 26uuu精品一区二区| 欧美日韩国产高清一区二区三区 | 一区二区av| 欧美日韩18| 99久久免费国产| 丁香一区二区三区| 国内不卡的二区三区中文字幕 | 自拍偷拍国产精品| 久久精品人人做人人爽人人| 欧美一区二区三区白人| 欧洲一区二区三区免费视频| 亚洲一区二区免费看| 日韩午夜av在线| 亚洲精品护士| 国产精品黄色| 狠狠色噜噜狠狠色综合久 | 亚洲国产中文字幕在线视频综合| 成人欧美一区二区三区视频网页| 欧美国产精品一区二区三区| 国产日韩亚洲欧美综合| 国产亚洲成aⅴ人片在线观看| 欧美tickling网站挠脚心| 3atv一区二区三区| 91麻豆精品国产91久久久使用方法 | 视频一区二区三区在线| 视频在线观看国产精品| 午夜伦欧美伦电影理论片| 亚洲国产另类精品专区| 亚洲国产精品一区二区www| 亚洲五月六月丁香激情| 亚洲国产精品久久一线不卡| 午夜欧美一区二区三区在线播放| 亚洲图片一区二区| 午夜精品视频在线观看| 日韩va欧美va亚洲va久久| 麻豆91在线播放免费| 久草热8精品视频在线观看| 极品瑜伽女神91| 风间由美性色一区二区三区| av亚洲精华国产精华| 欧美在线免费一级片| 极品日韩久久| 免播放器亚洲| 欧美日韩免费观看一区三区| 777色狠狠一区二区三区| 欧美tickle裸体挠脚心vk| 久久精品男人的天堂| 日韩毛片精品高清免费| 午夜久久福利影院| 国内精品写真在线观看| 丁香六月综合激情| 欧美日韩高清免费| 国产日韩欧美一区| 在线观看日产精品| 日韩色视频在线观看| 国产精品久久影院| 午夜精品福利一区二区三区蜜桃| 久久99精品视频| 91丝袜高跟美女视频| 中国成人在线视频|