国产精品嫩草99av在线_一区在线视频观看_欧美高清一区_欧美 日韩 国产 一区_99精品欧美一区二区三区_久久大香伊蕉在人线观看热2_一色屋精品视频在线观看网站_在线亚洲国产精品网站_亚洲区一区二区三区_你懂的视频一区二区

當前位置:首頁 > 科技  > 網絡

數學能力超ChatGPT 70B開源大模型火了:用AI微調AI

來源: 責編: 時間:2023-08-14 22:01:29 463觀看
導讀 用AI生成的指令微調羊駝大模型,數學能力超ChatGPT——微軟新開源大模型WizardMath來了。如下圖所示,經過GSM8k數據集測試,WizardMath數學能力直接擊敗了ChatGPT、Claude Instant 1、PaLM 2-540B等一

用AI生成的指令微調羊駝大模型,數學能力超ChatGPT——DWv28資訊網——每日最新資訊28at.com

微軟新開源大模型WizardMath來了。DWv28資訊網——每日最新資訊28at.com

數學能力超ChatGPT 70B開源大模型火了:用AI微調AIDWv28資訊網——每日最新資訊28at.com

如下圖所示,經過GSM8k數據集測試,WizardMath數學能力直接擊敗了ChatGPT、Claude Instant 1、PaLM 2-540B等一眾大模型——DWv28資訊網——每日最新資訊28at.com

并且是在參數只有700億,遠不及后三者的情況之下。DWv28資訊網——每日最新資訊28at.com

數學能力超ChatGPT 70B開源大模型火了:用AI微調AIDWv28資訊網——每日最新資訊28at.com

HuggingFace已上線3個在線可玩版本(分別為7B、13B和70B參數),各種數學題可以直接丟進去試一試。DWv28資訊網——每日最新資訊28at.com

比如解決下面這道四次多項式方程:DWv28資訊網——每日最新資訊28at.com

數學能力超ChatGPT 70B開源大模型火了:用AI微調AIDWv28資訊網——每日最新資訊28at.com

或者是一道簡單的微積分:DWv28資訊網——每日最新資訊28at.com

數學能力超ChatGPT 70B開源大模型火了:用AI微調AIDWv28資訊網——每日最新資訊28at.com

亦或者是稍微修改過的拉格朗日方程推導:DWv28資訊網——每日最新資訊28at.com

數學能力超ChatGPT 70B開源大模型火了:用AI微調AIDWv28資訊網——每日最新資訊28at.com

它都全部正確(過程也不需要等太久)。DWv28資訊網——每日最新資訊28at.com

有網友向作者表示:DWv28資訊網——每日最新資訊28at.com

效果真的很驚人,感謝你們對開源LLM的貢獻。DWv28資訊網——每日最新資訊28at.com

數學能力超ChatGPT 70B開源大模型火了:用AI微調AIDWv28資訊網——每日最新資訊28at.com

目前,相關代碼、復現方式以及論文也都開源或上線,GitHub短短幾天已攬獲4.8k標星。DWv28資訊網——每日最新資訊28at.com

數學能力超ChatGPT 70B開源大模型火了:用AI微調AIDWv28資訊網——每日最新資訊28at.com

那么,WizardMath究竟是如何做到的?DWv28資訊網——每日最新資訊28at.com

用AI生成的指令增強大模型能力DWv28資訊網——每日最新資訊28at.com

OpenAI的大模型(InstructGPT、GPT-4等)能夠取得巨大成功、去執行各種復雜和多樣化的任務,一部分原因是使用了真實人類用戶生成的開放域指令數據進行了微調。DWv28資訊網——每日最新資訊28at.com

然而,不是誰都能像這家公司一樣獲得這樣的指令數據集。DWv28資訊網——每日最新資訊28at.com

一是因為整個注釋過程極其昂貴且耗時,二是人工難以創建出足夠比例的高難度指令。DWv28資訊網——每日最新資訊28at.com

因此,開發出一種成本相對較低的、大規模開放域指令自動生產方法,成為當下指令調優語言模型的關鍵。DWv28資訊網——每日最新資訊28at.com

在此,作者將他們的方法命名為Evol Instruction。DWv28資訊網——每日最新資訊28at.com

它是一種利用AI來代替人類自動生成涵蓋各種難度級別開放域指令的新方法。DWv28資訊網——每日最新資訊28at.com

具體而言,Evol Instruction分為指令進化器和指令消除器。DWv28資訊網——每日最新資訊28at.com

其中指令進化器可通過深度進化(藍線)或廣度進化(紅線)兩種路徑,將簡單指令升級為更復雜的指令或創建一條全新指令。DWv28資訊網——每日最新資訊28at.com

具體執行哪一條?隨機選擇就好。DWv28資訊網——每日最新資訊28at.com

數學能力超ChatGPT 70B開源大模型火了:用AI微調AIDWv28資訊網——每日最新資訊28at.com

其中,深度進化的具體“進化法”,則是通過五種類型的操作來完成,包括:DWv28資訊網——每日最新資訊28at.com

添加約束(add constraints)、深化(deepening)、具體化(concretizing)、增加推理步驟(increase reasoning steps)和使輸入復雜化(complicate input)。DWv28資訊網——每日最新資訊28at.com

由于所有指令均由AI完成,有時難免會出現錯誤。因此,指令消除器就是用于過濾失敗指令的。DWv28資訊網——每日最新資訊28at.com

以下是一個具體示例,該方法從“1+1=?”開始,終通過以上步驟自動生成了相當多的新指令。DWv28資訊網——每日最新資訊28at.com

數學能力超ChatGPT 70B開源大模型火了:用AI微調AIDWv28資訊網——每日最新資訊28at.com

通過重復這一生成過程,終我們就能得到足夠多的指令,然后將它們合并并隨機打亂,組成一個難度級別均勻分布的指令集,就可以對基礎大模型進行微調了。DWv28資訊網——每日最新資訊28at.com

在此,作者選擇Alpaca的訓練數據(僅由175條人工創建的種子指令生成)作為初始數據集,然后使用ChatGPT的API執行了四個進化周期,終獲得25萬條指令。DWv28資訊網——每日最新資訊28at.com

為了與Vicuna的70k真實用戶數據(ShareGPT)進行公平比較,作者從這25萬條數據中抽取了等量的樣本,訓練LLaMA 7B模型,終得到WizardLM,結果WizardLM的性能明顯優于Vicuna。DWv28資訊網——每日最新資訊28at.com

(Alpaca:斯坦福在LLaMa-7B基礎上微調出來的模型;Vicuna,UC伯克利在LLaMa-13B的基礎上微調得來)DWv28資訊網——每日最新資訊28at.com

此外,在更為復雜的測試指令下,人類更喜歡WizardLM的輸出,而非ChatGPT,這表明該方法可以顯著提高LLM處理復雜指令的能力。DWv28資訊網——每日最新資訊28at.com

基于此,作者又利用Evol Instruction生成了很多數學領域相關的指令,然后微調羊駝大模型,得到了WizardMath。DWv28資訊網——每日最新資訊28at.com

其效果如開頭所示,在GSM8k數據集上測得其數學能力超越包括ChatGPT、Claude Instant 1、PaLM 2-540B等一眾大模型,位列第5名,僅次于GPT-4、Claud1.3和2.0,以及5400億參數的Flan-PaLM 2之后。DWv28資訊網——每日最新資訊28at.com

以此類推,作者還在羊駝之上得到了專攻代碼能力的WizardCoder,效果超越Claude和Bard(詳情可戳文末地址)。DWv28資訊網——每日最新資訊28at.com

數學能力超ChatGPT 70B開源大模型火了:用AI微調AIDWv28資訊網——每日最新資訊28at.com

團隊介紹本文共9位作者,全華人。DWv28資訊網——每日最新資訊28at.com

一作有3位:DWv28資訊網——每日最新資訊28at.com

Can Xu,微軟亞洲互聯網工程院S+D NLP組高級應用科學家,之前曾在微軟小冰研究組和微軟亞研院從事聊天機器人系統工作;DWv28資訊網——每日最新資訊28at.com

Qingfeng Sun, Microsoft Research科學家,研究方向為自然語言處理和信息檢索,精通構建高效搜索系統,為Microsoft Bing和Office 365貢獻了核心深度模型;DWv28資訊網——每日最新資訊28at.com

Kai Zheng,Microsoft Research科學家,研究方向為自然語言處理、搜索和推薦排名,同樣為Microsoft Bing和Office 365貢獻了核心深度模型。DWv28資訊網——每日最新資訊28at.com

數學能力超ChatGPT 70B開源大模型火了:用AI微調AIDWv28資訊網——每日最新資訊28at.com

通訊作者為姜大昕,微軟全球合伙人、副總裁、前微軟亞洲研究院首席科學家,在微軟工作16年有余、曾作為微軟必應搜索引擎和Cortana智能助手自然語言理解負責人,日前已被曝離職投身大模型創業。DWv28資訊網——每日最新資訊28at.com

另還有一位作者Jiazhan Feng,是北大學生,這篇合著論文是TA在微軟實習時產出的。DWv28資訊網——每日最新資訊28at.com

項目主頁: https://github.com/nlpxucan/WizardLM/tree/main/WizardMathDWv28資訊網——每日最新資訊28at.com


文章出處:量子位

本文鏈接:http://www.rrqrq.com/showinfo-17-5471-0.html數學能力超ChatGPT 70B開源大模型火了:用AI微調AI

聲明:本網頁內容旨在傳播知識,若有侵權等問題請及時與本網聯系,我們將在第一時間刪除處理。郵件:2376512515@qq.com

上一篇: 車輛被高速路石子砸了下 博主:成功向高速路政索賠了1600元

下一篇: 這款“讀博模擬器”太逼真!玩過的人都要崩潰了:你敢試試?

標簽:
  • 熱門焦點
  • 5月iOS設備好評榜:iPhone 14僅排第43?

    來到新的一月,安兔兔的各個榜單又重新匯總了數據,像安卓陣營的榜單都有著比較大的變動,不過iOS由于設備的更新換代并沒有那么快,所以相對來說變化并不大,特別是iOS好評榜,老款設
  • 谷歌KDD'23工作:如何提升推薦系統Ranking模型訓練穩定性

    谷歌在KDD 2023發表了一篇工作,探索了推薦系統ranking模型的訓練穩定性問題,分析了造成訓練穩定性存在問題的潛在原因,以及現有的一些提升模型穩定性方法的不足,并提出了一種新
  • Temu起訴SHEIN,跨境電商戰事升級

    來源 | 伯虎財經(bohuFN)作者 | 陳平安日前據外媒報道,拼多多旗下跨境電商平臺Temu正對競爭對手SHEIN提起新訴訟,訴狀稱Shein“利用市場支配力量強迫服裝廠商與之簽訂獨家
  • 花7萬退貨退款無門:誰在縱容淘寶珠寶商家造假?

    來源:極點商業作者:楊銘在淘寶購買珠寶玉石后,因為保證金不夠賠付,店鋪關閉,退貨退款難、維權無門的比比皆是。“提供相關產品鑒定證書,支持全國復檢,可以30天無理由退換貨。&
  • 大廠卷向扁平化

    來源:新熵作者丨南枝 編輯丨月見大廠職級不香了。俗話說,兵無常勢,水無常形,互聯網企業調整職級體系并不稀奇。7月13日,淘寶天貓集團啟動了近年來最大的人力制度改革,目前已形成一
  • 認真聊聊東方甄選:如何告別低垂的果實

    來源:山核桃作者:財經無忌爆火一年后,俞敏洪和他的東方甄選依舊是頗受外界關心的“網紅”。7月5日至9日,為期5天的東方甄選“甘肅行”首次在自有App內直播,
  • 華為Mate 60保護殼曝光:碩大后置相機模組 凸起程度有驚喜

    這段時間以來,關于華為新旗艦的爆料日漸密集。據此前多方爆料,今年華為將開始恢復一年雙旗艦戰略,除上半年推出的P60系列外,往年下半年的Mate系列也將
  • iQOO 11S評測:行業唯一的200W標準版旗艦

    【Techweb評測】去年底,iQOO推出了“電競旗艦”iQOO 11系列,作為一款性能強機,該機不僅全球首發2K 144Hz E6全感屏,搭載了第二代驍龍8平臺及144Hz電競
  • 質感不錯!OPPO K11渲染圖曝光:旗艦IMX890傳感器首次下放

    一直以來,OPPO K系列機型都保持著較為均衡的產品體驗,歷來都是2K價位的明星機型,去年推出的OPPO K10和OPPO K10 Pro兩款機型憑借各自的出色配置,堪稱有
Top 国产精品嫩草99av在线_一区在线视频观看_欧美高清一区_欧美 日韩 国产 一区_99精品欧美一区二区三区_久久大香伊蕉在人线观看热2_一色屋精品视频在线观看网站_在线亚洲国产精品网站_亚洲区一区二区三区_你懂的视频一区二区
丝袜脚交一区二区| 成人在线视频首页| 夜夜嗨av一区二区三区四季av| 久久久三级国产网站| 日韩写真欧美这视频| 91麻豆精品国产91久久久久| 欧美性感一区二区三区| 欧美中文字幕一区二区三区| 日本韩国精品在线| 欧美性色aⅴ视频一区日韩精品| 91黄色免费版| 日韩欧美一区中文| 国产亚洲精品资源在线26u| 欧美国产激情一区二区三区蜜月| 亚洲国产高清在线观看视频| ㊣最新国产の精品bt伙计久久| 一区在线播放视频| 亚洲综合视频在线观看| 午夜精品福利一区二区蜜股av| 三级亚洲高清视频| 黄页网站大全一区二区| 成人黄色电影在线| 激情综合电影网| 午夜一区在线| 欧美精品一级二级| 久久精品欧美日韩| 一区二区三区av电影| 美日韩一区二区| 成人少妇影院yyyy| 欧美日韩大片一区二区三区| 在线亚洲免费| 欧美日韩一卡二卡| 国产欧美日韩中文久久| 亚洲精品国产视频| 精品一区二区三区在线播放视频| 成人av网站免费观看| 影音先锋久久久| 欧美日韩一二区| 久久影院电视剧免费观看| 一区二区三区中文字幕精品精品 | 欧美日韩精品一区二区三区四区 | 亚洲伦在线观看| 久久国产麻豆精品| 黑人巨大精品欧美一区二区小视频 | 精品中文字幕一区二区小辣椒 | 在线91免费看| 精品视频免费在线| 911精品国产一区二区在线| 日韩欧美卡一卡二| 亚洲欧美怡红院| 免费看欧美美女黄的网站| 不卡av在线网| 99国产精品久久久久久久成人热| 色天天综合久久久久综合片| 26uuu国产日韩综合| 香蕉久久一区二区不卡无毒影院| 国产麻豆精品95视频| 亚洲精品影视| 精品国精品国产| 日本va欧美va欧美va精品| 亚洲另类春色校园小说| 精品一区二区免费| 18成人免费观看视频| 欧美高清hd18日本| 亚洲综合免费观看高清完整版在线 | 老鸭窝一区二区久久精品| 在线 亚洲欧美在线综合一区| 欧美性色黄大片手机版| 亚洲美女视频一区| 欧美.www| 日韩欧美国产三级| 久久精品999| 久久国产手机看片| 日本韩国精品在线| 欧美成人三级在线| 美女免费视频一区| 国产偷国产偷亚洲高清97cao| 久久久久久久久一| 国产成人av一区| 欧美日韩一区二区三区高清 | 99综合电影在线视频| 欧美中文字幕一区| 天天色图综合网| 国产毛片久久| 亚洲欧美偷拍卡通变态| 欧美亚韩一区| 国产人久久人人人人爽| 不卡的av中国片| 91精品国产高清一区二区三区蜜臀 | 日韩女同互慰一区二区| 国产做a爰片久久毛片| 精品久久久久久久久久久久包黑料| 性久久久久久久久| 亚洲免费网址| 亚洲大片在线观看| 国产精品乱码| 亚洲一区自拍偷拍| 亚洲综合国产| 亚洲成人在线观看视频| 蘑菇福利视频一区播放| 亚洲国产欧美日韩另类综合 | 色又黄又爽网站www久久| 午夜婷婷国产麻豆精品| 久久久777| 秋霞电影网一区二区| 91国偷自产一区二区开放时间| 日本怡春院一区二区| 欧美三级视频在线| 国产福利一区在线| 精品国产乱码久久久久久1区2区 | 国产成都精品91一区二区三| 欧美精品高清视频| 国产成人丝袜美腿| 日韩美女主播在线视频一区二区三区 | 成人av电影观看| 国产欧美日韩另类一区| 亚洲狠狠婷婷| 午夜精品视频一区| 欧美三区在线观看| 成人动漫视频在线| 国产精品免费久久| 亚洲欧美日韩国产综合精品二区| 视频一区免费在线观看| 在线不卡的av| 91美女精品福利| 亚洲综合色婷婷| 欧美日韩在线直播| 91视频观看视频| 一区二区三区中文字幕| 日本精品视频一区二区三区| 国产激情一区二区三区| 久久久久久影视| 亚洲欧美另类小说视频| 一本一道综合狠狠老| 国模少妇一区二区三区| 国产日产精品1区| 久久成人一区| 成人一道本在线| 国产精品盗摄一区二区三区| 久久婷婷亚洲| 97精品国产露脸对白| 亚洲欧美乱综合| 欧美日韩国产一二三| 国产一区欧美| 精品无人码麻豆乱码1区2区| 中文字幕二三区不卡| 在线中文字幕不卡| 欧美国产综合| 麻豆91精品91久久久的内涵| 久久久久国产精品人| 免费h精品视频在线播放| 成人国产在线观看| 视频一区免费在线观看| 国产欧美1区2区3区| 日本福利一区二区| 精品电影一区| 成人一区二区视频| 午夜久久久久久久久| 亚洲图片欧洲图片日韩av| 亚洲欧美日韩国产一区二区三区| 欧美亚洲图片小说| 精品白丝av| 成人a区在线观看| 亚洲综合激情网| 久久日韩精品一区二区五区| 色综合久久天天| 亚洲激情婷婷| 91免费在线看| 久久99精品国产.久久久久| 亚洲欧美日韩成人高清在线一区| 日韩免费观看高清完整版在线观看| 午夜亚洲性色福利视频| 伊人久久婷婷| 97国产一区二区| 国产精品中文有码| 全部av―极品视觉盛宴亚洲| 亚洲精品乱码久久久久久黑人| 精品捆绑美女sm三区| 欧美日韩国产一区| 久久精品盗摄| 亚洲一区二区三区四区中文| 国产精品久久| 91蜜桃免费观看视频| 国产伦精一区二区三区| 麻豆国产精品官网| 日本最新不卡在线| 无吗不卡中文字幕| 亚洲一区视频在线观看视频| 中文字幕制服丝袜一区二区三区 | 亚洲成a人片在线不卡一二三区| 国产精品久久久久久福利一牛影视 | 国产精品一区二区你懂的| 日本麻豆一区二区三区视频| 亚洲综合偷拍欧美一区色| 亚洲精品日韩一| 亚洲欧美偷拍另类a∨色屁股| 国产精品麻豆欧美日韩ww| 国产欧美精品一区二区色综合朱莉| 欧美一级在线观看| 欧美精品 国产精品|