国产精品嫩草99av在线_一区在线视频观看_欧美高清一区_欧美 日韩 国产 一区_99精品欧美一区二区三区_久久大香伊蕉在人线观看热2_一色屋精品视频在线观看网站_在线亚洲国产精品网站_亚洲区一区二区三区_你懂的视频一区二区

當前位置:首頁 > 科技  > 網絡

數學能力超ChatGPT 70B開源大模型火了:用AI微調AI

來源: 責編: 時間:2023-08-14 22:01:29 416觀看
導讀 用AI生成的指令微調羊駝大模型,數學能力超ChatGPT——微軟新開源大模型WizardMath來了。如下圖所示,經過GSM8k數據集測試,WizardMath數學能力直接擊敗了ChatGPT、Claude Instant 1、PaLM 2-540B等一

用AI生成的指令微調羊駝大模型,數學能力超ChatGPT——vQo28資訊網——每日最新資訊28at.com

微軟新開源大模型WizardMath來了。vQo28資訊網——每日最新資訊28at.com

數學能力超ChatGPT 70B開源大模型火了:用AI微調AIvQo28資訊網——每日最新資訊28at.com

如下圖所示,經過GSM8k數據集測試,WizardMath數學能力直接擊敗了ChatGPT、Claude Instant 1、PaLM 2-540B等一眾大模型——vQo28資訊網——每日最新資訊28at.com

并且是在參數只有700億,遠不及后三者的情況之下。vQo28資訊網——每日最新資訊28at.com

數學能力超ChatGPT 70B開源大模型火了:用AI微調AIvQo28資訊網——每日最新資訊28at.com

HuggingFace已上線3個在線可玩版本(分別為7B、13B和70B參數),各種數學題可以直接丟進去試一試。vQo28資訊網——每日最新資訊28at.com

比如解決下面這道四次多項式方程:vQo28資訊網——每日最新資訊28at.com

數學能力超ChatGPT 70B開源大模型火了:用AI微調AIvQo28資訊網——每日最新資訊28at.com

或者是一道簡單的微積分:vQo28資訊網——每日最新資訊28at.com

數學能力超ChatGPT 70B開源大模型火了:用AI微調AIvQo28資訊網——每日最新資訊28at.com

亦或者是稍微修改過的拉格朗日方程推導:vQo28資訊網——每日最新資訊28at.com

數學能力超ChatGPT 70B開源大模型火了:用AI微調AIvQo28資訊網——每日最新資訊28at.com

它都全部正確(過程也不需要等太久)。vQo28資訊網——每日最新資訊28at.com

有網友向作者表示:vQo28資訊網——每日最新資訊28at.com

效果真的很驚人,感謝你們對開源LLM的貢獻。vQo28資訊網——每日最新資訊28at.com

數學能力超ChatGPT 70B開源大模型火了:用AI微調AIvQo28資訊網——每日最新資訊28at.com

目前,相關代碼、復現方式以及論文也都開源或上線,GitHub短短幾天已攬獲4.8k標星。vQo28資訊網——每日最新資訊28at.com

數學能力超ChatGPT 70B開源大模型火了:用AI微調AIvQo28資訊網——每日最新資訊28at.com

那么,WizardMath究竟是如何做到的?vQo28資訊網——每日最新資訊28at.com

用AI生成的指令增強大模型能力vQo28資訊網——每日最新資訊28at.com

OpenAI的大模型(InstructGPT、GPT-4等)能夠取得巨大成功、去執行各種復雜和多樣化的任務,一部分原因是使用了真實人類用戶生成的開放域指令數據進行了微調。vQo28資訊網——每日最新資訊28at.com

然而,不是誰都能像這家公司一樣獲得這樣的指令數據集。vQo28資訊網——每日最新資訊28at.com

一是因為整個注釋過程極其昂貴且耗時,二是人工難以創建出足夠比例的高難度指令。vQo28資訊網——每日最新資訊28at.com

因此,開發出一種成本相對較低的、大規模開放域指令自動生產方法,成為當下指令調優語言模型的關鍵。vQo28資訊網——每日最新資訊28at.com

在此,作者將他們的方法命名為Evol Instruction。vQo28資訊網——每日最新資訊28at.com

它是一種利用AI來代替人類自動生成涵蓋各種難度級別開放域指令的新方法。vQo28資訊網——每日最新資訊28at.com

具體而言,Evol Instruction分為指令進化器和指令消除器。vQo28資訊網——每日最新資訊28at.com

其中指令進化器可通過深度進化(藍線)或廣度進化(紅線)兩種路徑,將簡單指令升級為更復雜的指令或創建一條全新指令。vQo28資訊網——每日最新資訊28at.com

具體執行哪一條?隨機選擇就好。vQo28資訊網——每日最新資訊28at.com

數學能力超ChatGPT 70B開源大模型火了:用AI微調AIvQo28資訊網——每日最新資訊28at.com

其中,深度進化的具體“進化法”,則是通過五種類型的操作來完成,包括:vQo28資訊網——每日最新資訊28at.com

添加約束(add constraints)、深化(deepening)、具體化(concretizing)、增加推理步驟(increase reasoning steps)和使輸入復雜化(complicate input)。vQo28資訊網——每日最新資訊28at.com

由于所有指令均由AI完成,有時難免會出現錯誤。因此,指令消除器就是用于過濾失敗指令的。vQo28資訊網——每日最新資訊28at.com

以下是一個具體示例,該方法從“1+1=?”開始,終通過以上步驟自動生成了相當多的新指令。vQo28資訊網——每日最新資訊28at.com

數學能力超ChatGPT 70B開源大模型火了:用AI微調AIvQo28資訊網——每日最新資訊28at.com

通過重復這一生成過程,終我們就能得到足夠多的指令,然后將它們合并并隨機打亂,組成一個難度級別均勻分布的指令集,就可以對基礎大模型進行微調了。vQo28資訊網——每日最新資訊28at.com

在此,作者選擇Alpaca的訓練數據(僅由175條人工創建的種子指令生成)作為初始數據集,然后使用ChatGPT的API執行了四個進化周期,終獲得25萬條指令。vQo28資訊網——每日最新資訊28at.com

為了與Vicuna的70k真實用戶數據(ShareGPT)進行公平比較,作者從這25萬條數據中抽取了等量的樣本,訓練LLaMA 7B模型,終得到WizardLM,結果WizardLM的性能明顯優于Vicuna。vQo28資訊網——每日最新資訊28at.com

(Alpaca:斯坦福在LLaMa-7B基礎上微調出來的模型;Vicuna,UC伯克利在LLaMa-13B的基礎上微調得來)vQo28資訊網——每日最新資訊28at.com

此外,在更為復雜的測試指令下,人類更喜歡WizardLM的輸出,而非ChatGPT,這表明該方法可以顯著提高LLM處理復雜指令的能力。vQo28資訊網——每日最新資訊28at.com

基于此,作者又利用Evol Instruction生成了很多數學領域相關的指令,然后微調羊駝大模型,得到了WizardMath。vQo28資訊網——每日最新資訊28at.com

其效果如開頭所示,在GSM8k數據集上測得其數學能力超越包括ChatGPT、Claude Instant 1、PaLM 2-540B等一眾大模型,位列第5名,僅次于GPT-4、Claud1.3和2.0,以及5400億參數的Flan-PaLM 2之后。vQo28資訊網——每日最新資訊28at.com

以此類推,作者還在羊駝之上得到了專攻代碼能力的WizardCoder,效果超越Claude和Bard(詳情可戳文末地址)。vQo28資訊網——每日最新資訊28at.com

數學能力超ChatGPT 70B開源大模型火了:用AI微調AIvQo28資訊網——每日最新資訊28at.com

團隊介紹本文共9位作者,全華人。vQo28資訊網——每日最新資訊28at.com

一作有3位:vQo28資訊網——每日最新資訊28at.com

Can Xu,微軟亞洲互聯網工程院S+D NLP組高級應用科學家,之前曾在微軟小冰研究組和微軟亞研院從事聊天機器人系統工作;vQo28資訊網——每日最新資訊28at.com

Qingfeng Sun, Microsoft Research科學家,研究方向為自然語言處理和信息檢索,精通構建高效搜索系統,為Microsoft Bing和Office 365貢獻了核心深度模型;vQo28資訊網——每日最新資訊28at.com

Kai Zheng,Microsoft Research科學家,研究方向為自然語言處理、搜索和推薦排名,同樣為Microsoft Bing和Office 365貢獻了核心深度模型。vQo28資訊網——每日最新資訊28at.com

數學能力超ChatGPT 70B開源大模型火了:用AI微調AIvQo28資訊網——每日最新資訊28at.com

通訊作者為姜大昕,微軟全球合伙人、副總裁、前微軟亞洲研究院首席科學家,在微軟工作16年有余、曾作為微軟必應搜索引擎和Cortana智能助手自然語言理解負責人,日前已被曝離職投身大模型創業。vQo28資訊網——每日最新資訊28at.com

另還有一位作者Jiazhan Feng,是北大學生,這篇合著論文是TA在微軟實習時產出的。vQo28資訊網——每日最新資訊28at.com

項目主頁: https://github.com/nlpxucan/WizardLM/tree/main/WizardMathvQo28資訊網——每日最新資訊28at.com


文章出處:量子位

本文鏈接:http://www.rrqrq.com/showinfo-17-5471-0.html數學能力超ChatGPT 70B開源大模型火了:用AI微調AI

聲明:本網頁內容旨在傳播知識,若有侵權等問題請及時與本網聯系,我們將在第一時間刪除處理。郵件:2376512515@qq.com

上一篇: 車輛被高速路石子砸了下 博主:成功向高速路政索賠了1600元

下一篇: 這款“讀博模擬器”太逼真!玩過的人都要崩潰了:你敢試試?

標簽:
  • 熱門焦點
Top 国产精品嫩草99av在线_一区在线视频观看_欧美高清一区_欧美 日韩 国产 一区_99精品欧美一区二区三区_久久大香伊蕉在人线观看热2_一色屋精品视频在线观看网站_在线亚洲国产精品网站_亚洲区一区二区三区_你懂的视频一区二区
在线欧美小视频| 国产福利视频一区二区三区| 精品一区二区在线看| 国产日韩欧美二区| 亚洲欧洲成人精品av97| 99视频在线精品| 日韩免费观看2025年上映的电影| 国产乱理伦片在线观看夜一区| 欧美日韩一卡二卡三卡| 麻豆91精品视频| 91国产成人在线| 美女一区二区视频| 在线观看亚洲精品| 免费精品视频在线| 欧美日韩一级二级三级| 九九久久精品视频| 欧美人妖巨大在线| 国产一区二区精品在线观看| 6080yy午夜一二三区久久| 国产成人精品综合在线观看| 制服丝袜亚洲精品中文字幕| 福利电影一区二区| 精品女同一区二区| 97久久人人超碰| 国产精品乱人伦中文| 日韩一级大片| 亚洲国产aⅴ天堂久久| 色悠悠亚洲一区二区| 久国产精品韩国三级视频| 91精品国产色综合久久ai换脸| 成人综合在线视频| 国产亚洲欧美色| 亚洲婷婷在线| 亚洲在线视频一区| 久久精品一区| 久久超碰97人人做人人爱| 欧美日韩免费一区二区三区视频| 国产成人免费视频精品含羞草妖精| 精品国产一区久久| 国模大胆一区二区三区| 久久中文字幕电影| 6080日韩午夜伦伦午夜伦| 国产精品一区二区x88av| 日韩精品中午字幕| 午夜精品剧场| 亚洲制服丝袜av| 欧美中文字幕一二三区视频| 国产成人午夜视频| 欧美激情一区在线观看| 国产精品手机视频| 男女视频一区二区| 日韩欧美国产一区二区三区| 午夜精品剧场| 亚洲一区视频在线| 欧美日韩在线免费视频| 99久精品国产| 亚洲一区二区三区四区在线观看 | 91久久国产最好的精华液| 国产一区亚洲一区| 国产亚洲成年网址在线观看| 99精品视频免费观看| 国产欧美日韩中文久久| 精品影视av免费| 欧美精品vⅰdeose4hd| 国产成人午夜精品影院观看视频| 国产欧美一区二区三区网站| 性8sex亚洲区入口| 国产精品538一区二区在线| 国产天堂亚洲国产碰碰| 国产精品尤物| 国产馆精品极品| 国产精品国产三级国产普通话三级 | 国产日韩免费| 精彩视频一区二区三区| 久久久精品天堂| 久久精品30| 高清在线不卡av| 一区二区视频在线看| 欧美日韩国产高清一区二区三区| 午夜精品短视频| 青青草91视频| 日本一区二区成人| 欧美熟乱第一页| 激情视频一区二区| 国内精品伊人久久久久av一坑| 国产精品麻豆一区二区| 欧美日本国产视频| 一区二区欧美日韩| 国产一区二区美女| 亚洲伦在线观看| 欧美一区二区视频在线观看2022| 亚洲日产国产精品| 国产传媒欧美日韩成人| 亚洲一区二区av在线| 精品免费国产一区二区三区四区| 国产伦精品一区二区三区高清版| 成人黄色av网站在线| 婷婷中文字幕综合| 久久精品一区四区| 欧美午夜视频网站| 国模吧视频一区| 国产成人亚洲精品狼色在线 | 91麻豆精品国产91久久久久| 99精品免费| yourporn久久国产精品| 免费成人av在线| 亚洲欧美日韩精品久久久久| 日韩精品一区二区三区四区视频| 蜜桃av综合| 欧美少妇一区| 风间由美中文字幕在线看视频国产欧美| 亚洲一区二区三区免费视频| 精品盗摄一区二区三区| 一本久久a久久精品亚洲| 国产精品激情| 国产成人av在线影院| 日日夜夜免费精品| 亚洲欧美一区二区不卡| 欧美精品一区二区久久婷婷| 欧美三级一区二区| 亚洲一区国产| 欧美色123| 99久久精品国产麻豆演员表| 国产在线日韩欧美| 丝袜a∨在线一区二区三区不卡| 国产视频视频一区| 日韩亚洲欧美成人一区| 欧美日韩专区在线| 国产精品视频免费一区| 国产综合自拍| 97精品久久久午夜一区二区三区 | 国产综合一区二区| 日韩在线观看一区二区| 一区二区三区在线视频观看| 国产欧美1区2区3区| 精品久久人人做人人爽| 欧美日韩国产bt| 在线亚洲一区观看| 国产精品久久亚洲7777| 在线看片成人| www.日韩在线| 美女视频网站黄色亚洲| 一区二区久久久久| 国产精品精品国产色婷婷| 精品日本一线二线三线不卡| 欧美日本高清视频在线观看| 日本福利一区二区| 国产精品一区二区你懂得| 国产一区日韩一区| 欧美尤物一区| aa级大片欧美| 成人午夜视频福利| 国产精品一区二区在线观看网站 | 国产欧美精品| 亚洲夫妻自拍| 亚洲午夜高清视频| 亚洲二区在线视频| 欧美精品 国产精品| 色欧美片视频在线观看在线视频| 中文亚洲免费| 136国产福利精品导航网址| 色综合视频在线观看| 99久免费精品视频在线观看| 国产99久久精品| 国产成人av一区二区三区在线| 黄页视频在线91| 狠狠v欧美v日韩v亚洲ⅴ| 另类中文字幕网| 日本成人中文字幕| 免费在线观看一区| 蜜臀av性久久久久蜜臀av麻豆 | 日韩亚洲欧美一区| 欧美日韩极品在线观看一区| 欧美系列日韩一区| 欧美日韩国产免费| 538在线一区二区精品国产| 91精品免费在线| 日韩区在线观看| 精品99久久久久久| 国产午夜精品久久久久久久| 国产午夜精品一区二区三区四区 | 免费久久精品视频| 男男视频亚洲欧美| 极品美女销魂一区二区三区| 国产一区二区成人久久免费影院| 国产精品69毛片高清亚洲| 高潮精品一区videoshd| av亚洲产国偷v产偷v自拍| 女生裸体视频一区二区三区| 欧美另类视频| 99精品欧美一区二区三区| 久久动漫亚洲| 欧美日韩极品在线观看一区| 日韩欧美www| 国产视频一区不卡| 一区二区免费看| 蜜臀久久久99精品久久久久久| 国产精品综合av一区二区国产馆| 成人网在线播放| 国内自拍一区|