国产精品嫩草99av在线_一区在线视频观看_欧美高清一区_欧美 日韩 国产 一区_99精品欧美一区二区三区_久久大香伊蕉在人线观看热2_一色屋精品视频在线观看网站_在线亚洲国产精品网站_亚洲区一区二区三区_你懂的视频一区二区

當(dāng)前位置:首頁 > 科技  > 軟件

英特爾 OpenVINO 賦能騰訊混元大模型,酷睿 Ultra Day0 適配

來源: 責(zé)編: 時(shí)間:2025-08-07 16:41:36 90觀看
導(dǎo)讀 今日,騰訊正式發(fā)布新一代混元開源大語言模型。英特爾憑借在人工智能領(lǐng)域的全棧技術(shù)布局,現(xiàn)已在英特爾? 酷睿?Ultra 平臺上完成針對該模型的第零日(Day 0)部署與性能優(yōu)化。值得一提的是,依托于 OpenVINO?構(gòu)建的

今日,騰訊正式發(fā)布新一代混元開源大語言模型。英特爾憑借在人工智能領(lǐng)域的全棧技術(shù)布局,現(xiàn)已在英特爾? 酷睿?Ultra 平臺上完成針對該模型的第零日(Day 0)部署與性能優(yōu)化。值得一提的是,依托于 OpenVINO?構(gòu)建的 AI 軟件平臺的可擴(kuò)展性,英特爾助力 ISV 生態(tài)伙伴率先實(shí)現(xiàn)應(yīng)用端 Day 0 模型適配,大幅加速了新模型的落地進(jìn)程,彰顯了“硬件 + 模型 + 生態(tài)”協(xié)同的強(qiáng)大爆發(fā)力。dtC28資訊網(wǎng)——每日最新資訊28at.com

dtC28資訊網(wǎng)——每日最新資訊28at.com

混元新模型登場:多維度突破,酷睿 Ultra 平臺 Day 0 適配dtC28資訊網(wǎng)——每日最新資訊28at.com

騰訊混元宣布開源四款小尺寸模型,參數(shù)分別為 0.5B、1.8B、4B、7B,消費(fèi)級顯卡即可運(yùn)行,適用于筆記本電腦、手機(jī)、智能座艙、智能家居等低功耗場景。新開源的 4 個(gè)模型均屬于融合推理模型,具備推理速度快、性價(jià)比高的特點(diǎn),用戶可根據(jù)使用場景靈活選擇模型思考模式 —— 快思考模式提供簡潔、高效的輸出;而慢思考涉及解決復(fù)雜問題,具備更全面的推理步驟。dtC28資訊網(wǎng)——每日最新資訊28at.com

這些模型已在英特爾酷睿 Ultra 平臺實(shí)現(xiàn)全面適配,其在 CPU、GPU、NPU 三大 AI 運(yùn)算引擎上都展現(xiàn)了卓越的推理性能表現(xiàn) 1。以酷睿 Ultra 2 代 iGPU 平臺為例,7B 參數(shù)量模型在 INT4 精度下,吞吐量達(dá) 20.93token / s;0.5B 小尺寸模型在 FP16 精度下吞吐量達(dá) 68.92token / s。值得一提的是,英特爾對新模型的 NPU 第零日支持已形成常態(tài)化能力,為不同參數(shù)量模型匹配精準(zhǔn)硬件方案,滿足從個(gè)人終端到邊緣設(shè)備的多樣化需求。dtC28資訊網(wǎng)——每日最新資訊28at.com

dtC28資訊網(wǎng)——每日最新資訊28at.com

OpenVINO:新模型快速落地的“關(guān)鍵引擎”dtC28資訊網(wǎng)——每日最新資訊28at.com

作為英特爾推出的開源深度學(xué)習(xí)工具套件,OpenVINO 以“性能優(yōu)化 + 跨平臺部署”為核心優(yōu)勢,可充分釋放英特爾硬件資源潛力,廣泛應(yīng)用于 AI PC、邊緣 AI 等場景。其核心價(jià)值在于能將深度學(xué)習(xí)模型的推理性能最大化,同時(shí)實(shí)現(xiàn)跨 CPU、GPU、NPU 等異構(gòu)硬件的無縫部署。dtC28資訊網(wǎng)——每日最新資訊28at.com

目前,OpenVINO 已支持超過 900 個(gè)人工智能模型,涵蓋生成式 AI 領(lǐng)域主流模型結(jié)構(gòu)與算子庫。這樣的模型支持體系,使其能在新模型發(fā)布的 Day 0,即完成英特爾硬件平臺的適配部署。此次混元模型的快速落地,正是 OpenVINO 技術(shù)實(shí)力的直接體現(xiàn) —— 通過其優(yōu)化能力,混元模型在酷睿 Ultra 平臺的性能得到充分釋放,為用戶帶來即發(fā)即用的 AI 體驗(yàn)。dtC28資訊網(wǎng)——每日最新資訊28at.com

生態(tài)共創(chuàng):AI 技術(shù)到應(yīng)用的“最后一公里”加速dtC28資訊網(wǎng)——每日最新資訊28at.com

生態(tài)合作是英特爾 AI 戰(zhàn)略的核心支柱,驅(qū)動(dòng)人生作為其長期合作伙伴,專注于互聯(lián)網(wǎng)客戶端軟件研發(fā)及運(yùn)營,本著“以用戶為中心,以技術(shù)為根本,以開放為原則”的理念,長期致力于技術(shù)研發(fā)和技術(shù)創(chuàng)新,為用戶提供優(yōu)質(zhì)的服務(wù)。其 AIGC 助手軟件,實(shí)現(xiàn)本地部署,離線使用,支持文字輸入、語音轉(zhuǎn)譯,將大模型裝進(jìn)背包,可隨時(shí)隨地與它進(jìn)行智能對話,還能讓它幫忙解讀文檔,編撰方案。dtC28資訊網(wǎng)——每日最新資訊28at.com

該應(yīng)用采用 OpenVINO 推理框架,借助其快速適配能力,在混元模型發(fā)布當(dāng)日即完成應(yīng)用層適配,成為首批支持新模型的應(yīng)用之一。dtC28資訊網(wǎng)——每日最新資訊28at.com

目前,驅(qū)動(dòng)人生 AIGC 助手、英特爾 AIPC 應(yīng)用專區(qū)和多家 OEM 應(yīng)用商店的 AI PC 專區(qū)均已上線,搭載混元模型的新版本也將在近期推出,用戶可第一時(shí)間體驗(yàn)更智能的交互與服務(wù)。這種“模型發(fā)布-硬件適配-應(yīng)用落地”的全鏈條第零日響應(yīng),正是英特爾生態(tài)協(xié)同能力的生動(dòng)寫照。dtC28資訊網(wǎng)——每日最新資訊28at.com

AI 的發(fā)展離不開模型創(chuàng)新與軟硬件生態(tài)協(xié)同 —— 模型如同燃料,生態(tài)則是驅(qū)動(dòng)前進(jìn)的引擎。英特爾通過硬件平臺、軟件工具與生態(tài)網(wǎng)絡(luò)的深度協(xié)同,實(shí)現(xiàn)對新模型的第零日適配,不僅加速了技術(shù)到應(yīng)用的轉(zhuǎn)化,更推動(dòng)著整個(gè) AI 產(chǎn)業(yè)的高效創(chuàng)新。未來,英特爾將持續(xù)深化與合作伙伴的協(xié)同,讓 AI 創(chuàng)新更快走進(jìn)千行百業(yè)與大眾生活。dtC28資訊網(wǎng)——每日最新資訊28at.com

快速上手指南dtC28資訊網(wǎng)——每日最新資訊28at.com

第一步,環(huán)境準(zhǔn)備dtC28資訊網(wǎng)——每日最新資訊28at.com

通過以下命令可以搭建基于 Python 的模型部署環(huán)境。dtC28資訊網(wǎng)——每日最新資訊28at.com

dtC28資訊網(wǎng)——每日最新資訊28at.com

該示例在以下環(huán)境中已得到驗(yàn)證:dtC28資訊網(wǎng)——每日最新資訊28at.com

硬件環(huán)境:dtC28資訊網(wǎng)——每日最新資訊28at.com

Intel?Core?Ultra 7 258VdtC28資訊網(wǎng)——每日最新資訊28at.com

iGPU Driver:32.0.101.6972dtC28資訊網(wǎng)——每日最新資訊28at.com

NPU Driver:32.0.100.4181dtC28資訊網(wǎng)——每日最新資訊28at.com

Memory: 32GBdtC28資訊網(wǎng)——每日最新資訊28at.com

操作系統(tǒng):dtC28資訊網(wǎng)——每日最新資訊28at.com

Windows 11 24H2 (26100.4061)dtC28資訊網(wǎng)——每日最新資訊28at.com

OpenVINO 版本:dtC28資訊網(wǎng)——每日最新資訊28at.com

openvino 2025.2.0dtC28資訊網(wǎng)——每日最新資訊28at.com

openvino-genai 2025.2.0.0dtC28資訊網(wǎng)——每日最新資訊28at.com

openvino-tokenizers 2025.2.0.0dtC28資訊網(wǎng)——每日最新資訊28at.com

Transformers 版本:dtC28資訊網(wǎng)——每日最新資訊28at.com

https://github.com/huggingface/transformers@4970b23cedaf745f963779b4eae68da281e8c6cadtC28資訊網(wǎng)——每日最新資訊28at.com

第二步,模型下載和轉(zhuǎn)換dtC28資訊網(wǎng)——每日最新資訊28at.com

在部署模型之前,我們首先需要將原始的 PyTorch 模型轉(zhuǎn)換為 OpenVINOTM 的 IR 靜態(tài)圖格式,并對其進(jìn)行壓縮,以實(shí)現(xiàn)更輕量化的部署和最佳的性能表現(xiàn)。通過 Optimum 提供的命令行工具 optimum-cli,我們可以一鍵完成模型的格式轉(zhuǎn)換和權(quán)重量化任務(wù):dtC28資訊網(wǎng)——每日最新資訊28at.com

dtC28資訊網(wǎng)——每日最新資訊28at.com

開發(fā)者可以根據(jù)模型的輸出結(jié)果,調(diào)整其中的量化參數(shù),包括:dtC28資訊網(wǎng)——每日最新資訊28at.com

--model:為模型在 HuggingFace 上的 model id,這里我們也提前下載原始模型,并將 model id 替換為原始模型的本地路徑,針對國內(nèi)開發(fā)者,推薦使用 ModelScope 魔搭社區(qū)作為原始模型的下載渠道,具體加載方式可以參考 ModelScope 官方指南:https://www.modelscope.cn/docs/models/downloaddtC28資訊網(wǎng)——每日最新資訊28at.com

--weight-format:量化精度,可以選擇 fp32,fp16,int8,int4,int4_sym_g128,int4_asym_g128,int4_sym_g64,int4_asym_g64dtC28資訊網(wǎng)——每日最新資訊28at.com

--group-size:權(quán)重里共享量化參數(shù)的通道數(shù)量dtC28資訊網(wǎng)——每日最新資訊28at.com

--ratio:int4 / int8 權(quán)重比例,默認(rèn)為 1.0,0.6 表示 60% 的權(quán)重以 int4 表,40% 以 int8 表示dtC28資訊網(wǎng)——每日最新資訊28at.com

--sym:是否開啟對稱量化dtC28資訊網(wǎng)——每日最新資訊28at.com

此外我們建議使用以下參數(shù)對運(yùn)行在 NPU 上的模型進(jìn)行量化,以達(dá)到性能和精度的平衡。dtC28資訊網(wǎng)——每日最新資訊28at.com

dtC28資訊網(wǎng)——每日最新資訊28at.com

這里的--backup-precision 是指混合量化精度中,8bit 參數(shù)的量化策略。dtC28資訊網(wǎng)——每日最新資訊28at.com

第三步,模型部署dtC28資訊網(wǎng)——每日最新資訊28at.com

目前我們推薦是用 openvino-genai 來部署大語言以及生成式 AI 任務(wù),它同時(shí)支持 Python 和 C++ 兩種編程語言,安裝容量不到 200MB,支持流式輸出以及多種采樣策略。dtC28資訊網(wǎng)——每日最新資訊28at.com

GenAI API 部署示例dtC28資訊網(wǎng)——每日最新資訊28at.com

dtC28資訊網(wǎng)——每日最新資訊28at.com

其中,'model_dir' 為 OpenVINOTM IR 格式的模型文件夾路徑,'device' 為模型部署設(shè)備,支持 CPU,GPU 以及 NPU。此外,openvino-genai 提供了 chat 模式的構(gòu)建方法,通過聲明 pipe.start_chat() 以及 pipe.finish_chat(),多輪聊天中的歷史數(shù)據(jù)將被以 kvcache 的形態(tài),在內(nèi)存中進(jìn)行管理,從而提升運(yùn)行效率。dtC28資訊網(wǎng)——每日最新資訊28at.com

開發(fā)者可以通過該該示例的中方法調(diào)整 chat template,以關(guān)閉和開啟 thinking 模式,具體方式可以參考官方文檔(https://huggingface.co/tencent/Hunyuan-4B-Instruct)。由于目前 OpenVINOTM Tokenizer 還沒有完全支持 Hunyuan-7B-Instruct 模型默認(rèn)的 chat template 格式,因此我們需要手動(dòng)替換原始的 chat template,對其進(jìn)行簡化,具體方法如下:dtC28資訊網(wǎng)——每日最新資訊28at.com

dtC28資訊網(wǎng)——每日最新資訊28at.com

chat 模式輸出結(jié)果示例:dtC28資訊網(wǎng)——每日最新資訊28at.com

dtC28資訊網(wǎng)——每日最新資訊28at.com

關(guān)于該示例的后續(xù)更新,可以關(guān)注 OpenVINO notebooks 倉庫:https://github.com/openvinotoolkit/openvino_notebooks/tree/latest/notebooks/llm-chatbotdtC28資訊網(wǎng)——每日最新資訊28at.com

驅(qū)動(dòng)人生應(yīng)用獲取方式:dtC28資訊網(wǎng)——每日最新資訊28at.com

驅(qū)動(dòng)人生 AIGC 助手 (https://www.160.com/aigc/index.html)dtC28資訊網(wǎng)——每日最新資訊28at.com

英特爾 AIPC 應(yīng)用專區(qū) (intel.cn/aipc)dtC28資訊網(wǎng)——每日最新資訊28at.com

1.通過使用 OpenVINO 框架版本 2025.2.0 在英特爾? 酷睿?Ultra 7 258V 和英特爾? 酷睿?Ultra 9 285H 上進(jìn)行測試獲得了性能數(shù)據(jù),計(jì)算過程發(fā)生在 iGPU 或 NPU 上。測試評估了首 Token 的延遲以及在 int4-mixed、int4-mixed-cw-sym 和 fp16 精度設(shè)置下 1K 輸入的平均吞吐量。每項(xiàng)測試在預(yù)熱階段后執(zhí)行三次,并選擇平均值作為報(bào)告數(shù)據(jù)。dtC28資訊網(wǎng)——每日最新資訊28at.com

性能因使用方式、配置和其他因素而異。請?jiān)L問 www.Intel.com/PerformanceIndex 了解更多信息。dtC28資訊網(wǎng)——每日最新資訊28at.com

性能結(jié)果基于測試時(shí)的配置狀態(tài),可能未反映所有公開可用的更新內(nèi)容。請參閱相關(guān)文檔以獲取配置詳情。沒有任何產(chǎn)品或組件能夠保證絕對安全。dtC28資訊網(wǎng)——每日最新資訊28at.com

您的實(shí)際成本和結(jié)果可能會(huì)有所不同。dtC28資訊網(wǎng)——每日最新資訊28at.com

相關(guān)英特爾技術(shù)可能需要啟用相關(guān)硬件、軟件或激活服務(wù)。dtC28資訊網(wǎng)——每日最新資訊28at.com

本文鏈接:http://www.rrqrq.com/showinfo-26-175842-0.html英特爾 OpenVINO 賦能騰訊混元大模型,酷睿 Ultra Day0 適配

聲明:本網(wǎng)頁內(nèi)容旨在傳播知識,若有侵權(quán)等問題請及時(shí)與本網(wǎng)聯(lián)系,我們將在第一時(shí)間刪除處理。郵件:2376512515@qq.com

上一篇: 廣域銘島的工業(yè) AI 精準(zhǔn)決策三要素:實(shí)時(shí)數(shù)據(jù)、機(jī)理模型與反饋機(jī)制

下一篇: 微算法科技 (NASDAQ:MLGO) 基于量子重加密技術(shù)構(gòu)建區(qū)塊鏈數(shù)據(jù)共享解決方案

標(biāo)簽:
  • 熱門焦點(diǎn)
Top 国产精品嫩草99av在线_一区在线视频观看_欧美高清一区_欧美 日韩 国产 一区_99精品欧美一区二区三区_久久大香伊蕉在人线观看热2_一色屋精品视频在线观看网站_在线亚洲国产精品网站_亚洲区一区二区三区_你懂的视频一区二区
国产精品腿扒开做爽爽爽挤奶网站| 亚洲电影视频在线| 国产一区二区三区黄| 欧美一区二区三区四区高清| 丝袜美腿亚洲一区二区图片| 国外精品视频| 精品国产91洋老外米糕| 国产一区日韩二区欧美三区| 久久精品主播| 亚洲自拍与偷拍| 亚洲日韩视频| 国产精品久久久久久久蜜臀| 色综合一区二区三区| 亚洲精品在线免费播放| 粉嫩嫩av羞羞动漫久久久| 欧美日韩视频在线第一区 | 一区二区三区成人精品| 国产亚洲欧美一区在线观看| 粉嫩一区二区三区性色av| 欧美一级夜夜爽| 国产乱色国产精品免费视频| 欧美一区永久视频免费观看| 国产成人午夜电影网| 717成人午夜免费福利电影| 国产综合色产在线精品| 在线电影院国产精品| 国产成人一区在线| 欧美成人性战久久| 99久久精品国产一区| 久久精品一二三| 亚洲午夜精品久久久久久app| 亚洲欧洲www| 国产欧美丝祙| 亚洲小说春色综合另类电影| 一本一本大道香蕉久在线精品| 免费在线一区观看| 欧美人牲a欧美精品| 成人精品在线视频观看| 久久久久久夜精品精品免费| 欧美日本久久| 伊人色综合久久天天| 久久久国产亚洲精品| 蜜桃一区二区三区在线观看| 9191久久久久久久久久久| 不卡在线观看av| 国产精品久久国产精麻豆99网站| 99视频一区| 日韩在线卡一卡二| 欧美日韩亚洲国产综合| 国产成人在线观看免费网站| 久久久久国产精品人| 亚洲电影成人| 视频在线观看一区| 欧美日韩不卡视频| 本田岬高潮一区二区三区| 国产精品传媒入口麻豆| 亚洲尤物精选| 国产在线精品一区二区| 久久久久久**毛片大全| 99re66热这里只有精品4| 日本在线不卡视频| 精品欧美一区二区在线观看| 黄色欧美成人| 日韩综合一区二区| 日韩欧美一卡二卡| 亚洲美女91| 久久狠狠亚洲综合| 久久综合资源网| 国产一区导航| 国产精品456露脸| 国产精品色在线观看| 久久综合图片| 成人精品视频网站| 一级女性全黄久久生活片免费| 欧美日韩一区二区三区不卡| 91蜜桃免费观看视频| 亚洲国产视频在线| 日韩欧美在线123| 1024成人| 极品美女销魂一区二区三区免费| 国产亚洲成aⅴ人片在线观看| 亚洲一区二区精品在线| 国产精品99久久久久| 18欧美亚洲精品| 99久久精品国产一区| 综合电影一区二区三区| 在线观看区一区二| 91在线码无精品| 亚洲高清视频中文字幕| 欧美va亚洲va香蕉在线| 国产一区白浆| 高清不卡在线观看| 亚洲一区二区在线观看视频 | 懂色av中文一区二区三区 | 国产一区二区精品久久99| 国产精品久久久久久久久动漫 | 国产一区二区三区的电影| 国产真实乱子伦精品视频| 国产精品久久久久影视| 欧美日韩成人在线一区| 在线日韩欧美| 国产xxx精品视频大全| 亚洲精品国久久99热| 日韩欧美你懂的| 国产精品一区二区三区免费观看| 国产91在线|亚洲| 亚洲国产视频网站| 久久综合精品国产一区二区三区| 久久精品二区| 欧美精品亚洲精品| 国产一二三精品| 夜夜嗨av一区二区三区中文字幕 | 成人看片黄a免费看在线| 亚洲成人动漫精品| 久久久www免费人成精品| 欧美主播一区二区三区美女| 黄色成人av网站| 成人午夜视频在线观看| 爽好久久久欧美精品| 国产欧美1区2区3区| 欧美日韩国产一级| 一区二区高清| av电影天堂一区二区在线观看| 日韩av中文在线观看| 亚洲天堂av一区| 久久综合久久综合久久综合| 欧美性做爰猛烈叫床潮| 亚洲综合欧美日韩| 欧美午夜精品理论片a级大开眼界 欧美午夜精品久久久久免费视 | 激情亚洲综合在线| 亚洲影视在线播放| 国产欧美在线观看一区| 欧美日韩情趣电影| 夜夜嗨av一区二区三区网站四季av| 成人av免费在线观看| 美脚の诱脚舐め脚责91| 一区二区久久久| 国产精品美女久久久久久2018| 欧美一区二区精美| 欧洲色大大久久| 亚洲欧美卡通另类91av | 色播五月激情综合网| 激情婷婷欧美| 99久久久国产精品免费蜜臀| 国产乱码精品一区二区三区av| 亚洲chinese男男1069| 综合在线观看色| 久久久九九九九| 欧美电视剧在线看免费| 欧美在线免费视屏| 久久精品官网| 99riav国产精品| 欧美日韩三级电影在线| 99久久免费视频.com| 寂寞少妇一区二区三区| 婷婷久久综合九色综合绿巨人 | 午夜激情久久久| 亚洲三级视频在线观看| 国产日韩欧美一区二区三区综合 | 中文字幕亚洲精品在线观看| 欧美精品一区二区三区一线天视频| 欧美日韩在线一区二区| 久久亚洲精品伦理| 亚洲欧美日韩精品久久久| 精品1区2区3区4区| 欧美在线播放一区二区| 国产1区2区3区精品美女| 精品一区二区三区在线观看国产| 亚洲一区二区三区四区在线免费观看| 中文在线资源观看网站视频免费不卡| 日韩免费观看高清完整版| 91精品国产丝袜白色高跟鞋| 欧美日韩国产片| 欧美日韩精品欧美日韩精品一综合 | 国产精品综合二区| 久久不见久久见中文字幕免费| 亚洲网友自拍偷拍| 亚洲午夜久久久久久久久久久 | 国产欧美综合色| 欧美精品一区二区久久婷婷| 日韩欧美国产小视频| 6080国产精品一区二区| 宅男噜噜噜66一区二区66| 欧美人牲a欧美精品| 欧美视频中文字幕| 欧美日韩在线一区二区| 91高清视频免费看| 欧美亚洲一区三区| 欧美精品一级二级三级| 欧美日韩成人综合天天影院| 欧美区视频在线观看| 欧美精品国产精品| 欧美一区二区三区视频在线| 欧美一区午夜视频在线观看| 日韩一区二区三区在线观看| 精品日韩欧美在线| 久久噜噜亚洲综合| 久久精品日产第一区二区三区高清版| 久久久精品日韩欧美| 欧美激情一区二区三区不卡|