国产精品嫩草99av在线_一区在线视频观看_欧美高清一区_欧美 日韩 国产 一区_99精品欧美一区二区三区_久久大香伊蕉在人线观看热2_一色屋精品视频在线观看网站_在线亚洲国产精品网站_亚洲区一区二区三区_你懂的视频一区二区

當(dāng)前位置:首頁 > 元宇宙 > AI

英偉達(dá)發(fā)布 Llama-3.1-Nemotron-51B AI 模型:創(chuàng)新神經(jīng)架構(gòu)搜索等技術(shù)讓單 H100 GPU 運(yùn)行 4 倍以上負(fù)載

來源: 責(zé)編: 時(shí)間:2024-09-27 16:34:24 154觀看
導(dǎo)讀 9 月 25 日消息,英偉達(dá) 9 月 23 日發(fā)布博文,宣布推出 Llama-3.1-Nemotron-51B AI 模型,源自 Meta 公司的 Llama-3.1-70B,不過創(chuàng)新使用神經(jīng)架構(gòu)搜索(NAS)方法,建立了一個(gè)高度準(zhǔn)確和高效的模型。Llama-3.1-Nemotron-51

9 月 25 日消息,英偉達(dá) 9 月 23 日發(fā)布博文,宣布推出 Llama-3.1-Nemotron-51B AI 模型,源自 Meta 公司的 Llama-3.1-70B,不過創(chuàng)新使用神經(jīng)架構(gòu)搜索(NAS)方法,建立了一個(gè)高度準(zhǔn)確和高效的模型。9Y128資訊網(wǎng)——每日最新資訊28at.com

Llama-3.1-Nemotron-51B 簡(jiǎn)介

Llama-3.1-Nemotron-51B AI 模型基于Meta 公司 2024 年 7 月發(fā)布的 Llama-3.1-70B 模型,共有 510 億參數(shù)。9Y128資訊網(wǎng)——每日最新資訊28at.com

該 AI 模型主要采用了神經(jīng)架構(gòu)搜索(NAS)技術(shù)微調(diào),平衡性能和效率,在高工作負(fù)荷下,只需要一片 H100 GPU 即可運(yùn)行,大大降低了內(nèi)存消耗、計(jì)算復(fù)雜性以及與運(yùn)行此類大型模型相關(guān)的成本。9Y128資訊網(wǎng)——每日最新資訊28at.com

英偉達(dá)認(rèn)為這種方式在保持了出色的精度前提下,顯著降低了內(nèi)存占用、內(nèi)存帶寬和 FLOPs,并證明可以在創(chuàng)建另一個(gè)更小、更快的變體來加以推廣。9Y128資訊網(wǎng)——每日最新資訊28at.com

Llama-3.1-Nemotron-51B 性能

相比較 Meta 的 Llama-3.1-70B 模型,Llama-3.1-Nemotron-51B 在保持了幾乎相同的精度情況下,推理速度提高了 2.2 倍。9Y128資訊網(wǎng)——每日最新資訊28at.com

準(zhǔn)確率能效 MT BenchMMLUText generation(128/1024)Summarization/ RAG (2048/128)Llama-3.1- Nemotron-51B- Instruct8.9980.2%6472653Llama 3.1-70B- Instruct8.9381.66%2975339Llama 3.1-70B- Instruct (single GPU)——1274301Llama 3-70B8.9480.17%2975339效率和性能方面的突破

開發(fā) LLM 過程中面臨的主要挑戰(zhàn)之一是如何平衡精度與計(jì)算效率。許多大規(guī)模模型都能提供最先進(jìn)的結(jié)果,但卻需要耗費(fèi)大量的硬件和能源資源,這限制了它們的適用性。9Y128資訊網(wǎng)——每日最新資訊28at.com

英偉達(dá)的新模型在這兩個(gè)相互競(jìng)爭(zhēng)的因素之間取得了微妙的平衡。9Y128資訊網(wǎng)——每日最新資訊28at.com

9Y128資訊網(wǎng)——每日最新資訊28at.com

Llama-3.1-Nemotron-51B 實(shí)現(xiàn)了令人印象深刻的精度與效率權(quán)衡,減少了內(nèi)存帶寬,降低了每秒浮點(diǎn)運(yùn)算次數(shù) (FLOP),并減少了總體內(nèi)存占用,同時(shí)不影響模型執(zhí)行推理、總結(jié)和語言生成等復(fù)雜任務(wù)的能力。9Y128資訊網(wǎng)——每日最新資訊28at.com

改進(jìn)工作量管理,提高成本效益

Llama-3.1-Nemotron-51B 的一個(gè)突出特點(diǎn)是能夠在單個(gè) GPU 上管理更大的工作負(fù)載。該型號(hào)允許開發(fā)人員在更具成本效益的環(huán)境中部署高性能 LLMs,在一個(gè) H100 設(shè)備上運(yùn)行以前需要多個(gè) GPU 才能完成的任務(wù)。9Y128資訊網(wǎng)——每日最新資訊28at.com

Llama-3.1-Nemotron-51B 模型還減少了內(nèi)存占用,在推理過程中可以在單個(gè) GPU 上運(yùn)行 4 倍以上的工作負(fù)載,從而帶來了一系列新的機(jī)遇。9Y128資訊網(wǎng)——每日最新資訊28at.com

架構(gòu)優(yōu)化:成功的關(guān)鍵

Llama-3.1-Nemotron-51B 的成功主要?dú)w功于一種新穎的結(jié)構(gòu)優(yōu)化方法。傳統(tǒng)上,LLMs 是使用相同的塊構(gòu)建的,這些塊在整個(gè)模型中重復(fù)出現(xiàn)。9Y128資訊網(wǎng)——每日最新資訊28at.com

這雖然簡(jiǎn)化了構(gòu)建過程,但也帶來了效率低下的問題,特別是在內(nèi)存和計(jì)算成本方面。9Y128資訊網(wǎng)——每日最新資訊28at.com

英偉達(dá)通過采用 NAS 技術(shù)來優(yōu)化推理模型,從而解決了這些問題。該團(tuán)隊(duì)采用了分塊蒸餾過程,即訓(xùn)練更小、更高效的學(xué)生模型(student model),以模仿更大的教師模型(teacher model)的功能。9Y128資訊網(wǎng)——每日最新資訊28at.com

9Y128資訊網(wǎng)——每日最新資訊28at.com

通過完善這些學(xué)生模型并評(píng)估其性能,英偉達(dá)開發(fā)出了 Llama-3.1 版本,在大幅降低資源需求的同時(shí),還能提供類似的準(zhǔn)確度。9Y128資訊網(wǎng)——每日最新資訊28at.com

Puzzle 算法和知識(shí)蒸餾

Llama-3.1-Nemotron-51B 有別于其他模型的另一個(gè)關(guān)鍵組件,就是 Puzzle 算法。9Y128資訊網(wǎng)——每日最新資訊28at.com

9Y128資訊網(wǎng)——每日最新資訊28at.com

該算法對(duì)模型中的每個(gè)潛在區(qū)塊進(jìn)行評(píng)分,并確定哪些配置能在速度和精度之間取得最佳平衡。9Y128資訊網(wǎng)——每日最新資訊28at.com

跑分 Llama-3.1 70B-instructLlama-3.1-Nemotron-51B- Instruct 準(zhǔn)確率winogrande85.08%84.53%99.35%arc_challenge70.39%69.20%98.30%MMLU81.66%80.20%98.21%hellaswag86.44%85.58%99.01%gsm8k92.04%91.43%99.34%truthfulqa59.86%58.63%97.94%xlsum_english33.86%31.61%93.36%MMLU Chat81.76%80.58%98.55%gsm8k Chat81.58%81.88%100.37%Instruct HumanEval (n=20)75.85%73.84%97.35%MT Bench8.938.99100.67%

通過使用知識(shí)蒸餾技術(shù),Nvidia 縮小了參考模型(Llama-3.1-70B)與 Nemotron-51B 之間的精度差距,同時(shí)顯著降低了訓(xùn)練成本。9Y128資訊網(wǎng)——每日最新資訊28at.com

場(chǎng)景 Input/Output Sequence LengthLlama-3.1- Nemotron- InstructLlama-3.1-70B-InstructRatioLlama (TP1)Chatbot128/1285478 (TP1)2645 (TP1)2.072645Text generation128/10246472 (TP1)2975 (TP4)2.171274Long text generation128/20484910 (TP2)2786 (TP4)1.76646System 2 reasoning128/40963855 (TP2)1828 (TP4)2.11313Summarization/ RAG2048/128653 (TP1)339 (TP4)1.92300Stress test 12048/20482622 (TP2)1336 (TP4)1.96319

9Y128資訊網(wǎng)——每日最新資訊28at.com

附上參考地址9Y128資訊網(wǎng)——每日最新資訊28at.com

Advancing the Accuracy-Efficiency Frontier with Llama-3.1-Nemotron-51B9Y128資訊網(wǎng)——每日最新資訊28at.com

Nvidia AI Releases Llama-3.1-Nemotron-51B: A New LLM that Enables Running 4x Larger Workloads on a Single GPU During Inference9Y128資訊網(wǎng)——每日最新資訊28at.com

本文鏈接:http://www.rrqrq.com/showinfo-45-7797-0.html英偉達(dá)發(fā)布 Llama-3.1-Nemotron-51B AI 模型:創(chuàng)新神經(jīng)架構(gòu)搜索等技術(shù)讓單 H100 GPU 運(yùn)行 4 倍以上負(fù)載

聲明:本網(wǎng)頁內(nèi)容旨在傳播知識(shí),若有侵權(quán)等問題請(qǐng)及時(shí)與本網(wǎng)聯(lián)系,我們將在第一時(shí)間刪除處理。郵件:[email protected]

上一篇: 星紀(jì)魅族正在開發(fā)星紀(jì)戰(zhàn)車、機(jī)器人等新品

下一篇: 微軟發(fā)布新工具,檢測(cè)和糾正 AI 幻覺內(nèi)容

標(biāo)簽:
  • 熱門焦點(diǎn)
Top 国产精品嫩草99av在线_一区在线视频观看_欧美高清一区_欧美 日韩 国产 一区_99精品欧美一区二区三区_久久大香伊蕉在人线观看热2_一色屋精品视频在线观看网站_在线亚洲国产精品网站_亚洲区一区二区三区_你懂的视频一区二区
美日韩一区二区| 欧美成人蜜桃| 免费三级欧美电影| 午夜一区二区三区在线观看| 亚洲一区在线看| 亚洲一区在线观看免费观看电影高清 | 国内精品久久国产| 欧美国产综合| 激情六月综合| 午夜在线精品| 在线欧美日韩国产| 欧美精品乱码久久久久久按摩| 3d成人h动漫网站入口| 欧美一级专区免费大片| 精品精品国产高清一毛片一天堂| 久久午夜电影网| 国产精品女人毛片| 一区二区三区日韩欧美精品| 亚洲成人自拍一区| 国产尤物一区二区| 91麻豆免费在线观看| 亚洲人成毛片在线播放女女| 久久精品国产清高在天天线| 欧美日本不卡视频| 日本一区二区视频在线| 一区二区在线观看不卡| 日韩电影免费一区| 成人激情免费网站| 亚洲欧洲精品一区二区三区波多野1战4| 在线一区日本视频| 欧美日韩成人高清| 国产日产欧美一区二区三区| 一区二区三区91| 极品美女销魂一区二区三区| 91亚洲大成网污www| 国产一区成人| 日韩欧美123| 一区二区三区影院| 国产成人精品综合在线观看| 激情综合激情| 欧美精品xxxxbbbb| 中文字幕亚洲在| 麻豆精品新av中文字幕| 色综合久久综合网| 色成年激情久久综合| www激情久久| 日韩专区欧美专区| 欧美精品午夜| 欧美色综合天天久久综合精品| 精品日韩一区二区三区| 丝瓜av网站精品一区二区 | 欧美午夜精品电影| 中文字幕亚洲一区二区av在线 | gogogo免费视频观看亚洲一| 亚洲欧美精品在线观看| 久久综合狠狠综合| 日本欧美一区二区| 亚洲福利专区| 亚洲精品一区二区三区四区高清| 亚洲一区二区av电影| 91丨porny丨户外露出| 欧美视频中文字幕| 一区二区三区在线视频免费 | 很黄很黄激情成人| 日韩一区二区在线看片| 五月天视频一区| 欧美日韩一区二区三区在线观看免 | 麻豆成人久久精品二区三区红 | 国产精品乱人伦中文| 国产大陆精品国产| 欧美在线你懂得| 亚洲一区二区视频在线| 国产综合色一区二区三区| 欧美一区二区三区色| 日韩av中文字幕一区二区| 在线亚洲自拍| 日韩美女啊v在线免费观看| caoporm超碰国产精品| 欧美剧情片在线观看| 秋霞电影网一区二区| 国产日韩欧美精品| 日韩美女久久久| 欧美日韩免费高清| 久久精品亚洲一区二区三区浴池 | 97久久精品人人爽人人爽蜜臀| 色丁香久综合在线久综合在线观看| 玉足女爽爽91| 一本色道88久久加勒比精品| 国产精品美女久久久久久2018| 成人手机电影网| 欧美一区二区三区四区久久| 韩日精品视频一区| 欧美日韩一区不卡| 韩国成人福利片在线播放| 在线观看av不卡| 久久99日本精品| 欧美午夜精品免费| 国内精品在线播放| 3d动漫精品啪啪一区二区竹菊| 激情小说欧美图片| 在线播放91灌醉迷j高跟美女 | 亚洲欧洲日本mm| 一区二区久久久久久| 99精品国产福利在线观看免费| 亚洲精选视频免费看| 日韩一级不卡| 天天色天天操综合| 欧美日韩一级大片网址| 久久精工是国产品牌吗| 91精品国产综合久久香蕉的特点| 国产剧情av麻豆香蕉精品| 精品久久久网站| 欧美日韩在线不卡一区| 亚洲精品一二三| 男女精品网站| 国产乱码精品一区二区三区忘忧草| 91精品国产一区二区三区蜜臀 | 欧美天堂亚洲电影院在线播放| 激情综合色丁香一区二区| 日韩一级高清毛片| 午夜国产欧美理论在线播放 | 亚洲美女毛片| 无码av免费一区二区三区试看| 欧美性xxxxxx少妇| 99久久99久久精品免费观看 | 色综合中文综合网| 一道本成人在线| 国产精品91xxx| 欧美高清一级片在线观看| 在线亚洲成人| 韩国三级中文字幕hd久久精品| 精品日产卡一卡二卡麻豆| 精品动漫3d一区二区三区免费版| 亚洲成a人v欧美综合天堂| 欧美日本精品一区二区三区| 91视频在线观看| 亚洲成人在线免费| 日韩久久免费av| 在线视频一区观看| 国产激情91久久精品导航| 亚洲色图制服诱惑| 欧美欧美欧美欧美首页| 午夜欧美精品| 麻豆国产欧美一区二区三区| 久久精品夜色噜噜亚洲aⅴ| 国产精品一区在线播放| 国产成人免费视频网站| 一区二区三区久久久| 日韩一区二区高清| 国产一区二区三区免费不卡| 国产老女人精品毛片久久| 亚洲精品乱码久久久久久日本蜜臀| 欧美图区在线视频| 亚洲精品欧洲| 成人黄色在线看| 日韩高清在线不卡| 国产精品美女久久久久久久久| 欧美日韩国产一区| 一本色道久久综合| 91一区在线观看| 精品一区二区三区在线观看| 亚洲欧美电影院| 久久日韩粉嫩一区二区三区| 在线中文字幕一区二区| 在线高清一区| 91亚洲精品久久久蜜桃| 国产一区二区三区免费在线观看 | 成人av电影在线| 热久久免费视频| 樱花影视一区二区| 国产片一区二区| 欧美精品123区| 一本一本久久a久久精品综合麻豆| 欧美午夜精品| av中文字幕一区| 国产剧情一区在线| 久久国产精品72免费观看| 亚洲一区欧美一区| 中文字幕一区二区三区在线不卡| 欧美xxxxx牲另类人与| 欧美日韩国产综合视频在线观看 | 亚洲欧美偷拍三级| 欧美激情在线看| 久久精品这里都是精品| 欧美一级片在线观看| 欧美色图一区二区三区| 久久精品人人| 欧美主播一区二区三区美女 久久精品人| 欧美欧美天天天天操| 欧美一区二视频在线免费观看| 国产不卡在线一区| 国产精品一区二区久久不卡| 久久激情综合网| 日韩国产欧美三级| 日韩专区在线视频| 日本欧美加勒比视频| 日韩成人一级大片| 麻豆精品久久久| 久久精品国产精品亚洲精品| 免费成人美女在线观看|