當(dāng)前位置：首頁 > 科技 > 軟件

英特爾 OpenVINO 賦能騰訊混元大模型，酷睿 Ultra Day0 適配

來源：責(zé)編：時(shí)間：2025-08-07 16:41:36 90觀看

導(dǎo)讀今日，騰訊正式發(fā)布新一代混元開源大語言模型。英特爾憑借在人工智能領(lǐng)域的全棧技術(shù)布局，現(xiàn)已在英特爾? 酷睿?Ultra 平臺上完成針對該模型的第零日（Day 0）部署與性能優(yōu)化。值得一提的是，依托于 OpenVINO?構(gòu)建的

今日，騰訊正式發(fā)布新一代混元開源大語言模型。英特爾憑借在人工智能領(lǐng)域的全棧技術(shù)布局，現(xiàn)已在英特爾? 酷睿?Ultra 平臺上完成針對該模型的第零日（Day 0）部署與性能優(yōu)化。值得一提的是，依托于 OpenVINO?構(gòu)建的 AI 軟件平臺的可擴(kuò)展性，英特爾助力 ISV 生態(tài)伙伴率先實(shí)現(xiàn)應(yīng)用端 Day 0 模型適配，大幅加速了新模型的落地進(jìn)程，彰顯了“硬件 + 模型 + 生態(tài)”協(xié)同的強(qiáng)大爆發(fā)力。

混元新模型登場：多維度突破，酷睿 Ultra 平臺 Day 0 適配

騰訊混元宣布開源四款小尺寸模型，參數(shù)分別為 0.5B、1.8B、4B、7B，消費(fèi)級顯卡即可運(yùn)行，適用于筆記本電腦、手機(jī)、智能座艙、智能家居等低功耗場景。新開源的 4 個(gè)模型均屬于融合推理模型，具備推理速度快、性價(jià)比高的特點(diǎn)，用戶可根據(jù)使用場景靈活選擇模型思考模式 —— 快思考模式提供簡潔、高效的輸出；而慢思考涉及解決復(fù)雜問題，具備更全面的推理步驟。

這些模型已在英特爾酷睿 Ultra 平臺實(shí)現(xiàn)全面適配，其在 CPU、GPU、NPU 三大 AI 運(yùn)算引擎上都展現(xiàn)了卓越的推理性能表現(xiàn) 1。以酷睿 Ultra 2 代 iGPU 平臺為例，7B 參數(shù)量模型在 INT4 精度下，吞吐量達(dá) 20.93token / s；0.5B 小尺寸模型在 FP16 精度下吞吐量達(dá) 68.92token / s。值得一提的是，英特爾對新模型的 NPU 第零日支持已形成常態(tài)化能力，為不同參數(shù)量模型匹配精準(zhǔn)硬件方案，滿足從個(gè)人終端到邊緣設(shè)備的多樣化需求。

OpenVINO：新模型快速落地的“關(guān)鍵引擎”

作為英特爾推出的開源深度學(xué)習(xí)工具套件，OpenVINO 以“性能優(yōu)化 + 跨平臺部署”為核心優(yōu)勢，可充分釋放英特爾硬件資源潛力，廣泛應(yīng)用于 AI PC、邊緣 AI 等場景。其核心價(jià)值在于能將深度學(xué)習(xí)模型的推理性能最大化，同時(shí)實(shí)現(xiàn)跨 CPU、GPU、NPU 等異構(gòu)硬件的無縫部署。

目前，OpenVINO 已支持超過 900 個(gè)人工智能模型，涵蓋生成式 AI 領(lǐng)域主流模型結(jié)構(gòu)與算子庫。這樣的模型支持體系，使其能在新模型發(fā)布的 Day 0，即完成英特爾硬件平臺的適配部署。此次混元模型的快速落地，正是 OpenVINO 技術(shù)實(shí)力的直接體現(xiàn) —— 通過其優(yōu)化能力，混元模型在酷睿 Ultra 平臺的性能得到充分釋放，為用戶帶來即發(fā)即用的 AI 體驗(yàn)。

生態(tài)共創(chuàng)：AI 技術(shù)到應(yīng)用的“最后一公里”加速

生態(tài)合作是英特爾 AI 戰(zhàn)略的核心支柱，驅(qū)動(dòng)人生作為其長期合作伙伴，專注于互聯(lián)網(wǎng)客戶端軟件研發(fā)及運(yùn)營，本著“以用戶為中心，以技術(shù)為根本，以開放為原則”的理念，長期致力于技術(shù)研發(fā)和技術(shù)創(chuàng)新，為用戶提供優(yōu)質(zhì)的服務(wù)。其 AIGC 助手軟件，實(shí)現(xiàn)本地部署，離線使用，支持文字輸入、語音轉(zhuǎn)譯，將大模型裝進(jìn)背包，可隨時(shí)隨地與它進(jìn)行智能對話，還能讓它幫忙解讀文檔，編撰方案。

該應(yīng)用采用 OpenVINO 推理框架，借助其快速適配能力，在混元模型發(fā)布當(dāng)日即完成應(yīng)用層適配，成為首批支持新模型的應(yīng)用之一。

目前，驅(qū)動(dòng)人生 AIGC 助手、英特爾 AIPC 應(yīng)用專區(qū)和多家 OEM 應(yīng)用商店的 AI PC 專區(qū)均已上線，搭載混元模型的新版本也將在近期推出，用戶可第一時(shí)間體驗(yàn)更智能的交互與服務(wù)。這種“模型發(fā)布-硬件適配-應(yīng)用落地”的全鏈條第零日響應(yīng)，正是英特爾生態(tài)協(xié)同能力的生動(dòng)寫照。

AI 的發(fā)展離不開模型創(chuàng)新與軟硬件生態(tài)協(xié)同 —— 模型如同燃料，生態(tài)則是驅(qū)動(dòng)前進(jìn)的引擎。英特爾通過硬件平臺、軟件工具與生態(tài)網(wǎng)絡(luò)的深度協(xié)同，實(shí)現(xiàn)對新模型的第零日適配，不僅加速了技術(shù)到應(yīng)用的轉(zhuǎn)化，更推動(dòng)著整個(gè) AI 產(chǎn)業(yè)的高效創(chuàng)新。未來，英特爾將持續(xù)深化與合作伙伴的協(xié)同，讓 AI 創(chuàng)新更快走進(jìn)千行百業(yè)與大眾生活。

快速上手指南

第一步，環(huán)境準(zhǔn)備

通過以下命令可以搭建基于 Python 的模型部署環(huán)境。

該示例在以下環(huán)境中已得到驗(yàn)證：

硬件環(huán)境:

Intel?Core?Ultra 7 258V

iGPU Driver：32.0.101.6972

NPU Driver：32.0.100.4181

Memory: 32GB

操作系統(tǒng)：

Windows 11 24H2 (26100.4061)

OpenVINO 版本:

openvino 2025.2.0

openvino-genai 2025.2.0.0

openvino-tokenizers 2025.2.0.0

Transformers 版本:

https://github.com/huggingface/transformers@4970b23cedaf745f963779b4eae68da281e8c6ca

第二步，模型下載和轉(zhuǎn)換

在部署模型之前，我們首先需要將原始的 PyTorch 模型轉(zhuǎn)換為 OpenVINOTM 的 IR 靜態(tài)圖格式，并對其進(jìn)行壓縮，以實(shí)現(xiàn)更輕量化的部署和最佳的性能表現(xiàn)。通過 Optimum 提供的命令行工具 optimum-cli，我們可以一鍵完成模型的格式轉(zhuǎn)換和權(quán)重量化任務(wù)：

開發(fā)者可以根據(jù)模型的輸出結(jié)果，調(diào)整其中的量化參數(shù)，包括：

--model：為模型在 HuggingFace 上的 model id，這里我們也提前下載原始模型，并將 model id 替換為原始模型的本地路徑，針對國內(nèi)開發(fā)者，推薦使用 ModelScope 魔搭社區(qū)作為原始模型的下載渠道，具體加載方式可以參考 ModelScope 官方指南：https://www.modelscope.cn/docs/models/download

--weight-format：量化精度，可以選擇 fp32,fp16,int8,int4,int4_sym_g128,int4_asym_g128,int4_sym_g64,int4_asym_g64

--group-size：權(quán)重里共享量化參數(shù)的通道數(shù)量

--ratio：int4 / int8 權(quán)重比例，默認(rèn)為 1.0，0.6 表示 60% 的權(quán)重以 int4 表，40% 以 int8 表示

--sym：是否開啟對稱量化

此外我們建議使用以下參數(shù)對運(yùn)行在 NPU 上的模型進(jìn)行量化，以達(dá)到性能和精度的平衡。

這里的--backup-precision 是指混合量化精度中，8bit 參數(shù)的量化策略。

第三步，模型部署

目前我們推薦是用 openvino-genai 來部署大語言以及生成式 AI 任務(wù)，它同時(shí)支持 Python 和 C++ 兩種編程語言，安裝容量不到 200MB，支持流式輸出以及多種采樣策略。

GenAI API 部署示例

其中，'model_dir' 為 OpenVINOTM IR 格式的模型文件夾路徑，'device' 為模型部署設(shè)備，支持 CPU,GPU 以及 NPU。此外，openvino-genai 提供了 chat 模式的構(gòu)建方法，通過聲明 pipe.start_chat() 以及 pipe.finish_chat()，多輪聊天中的歷史數(shù)據(jù)將被以 kvcache 的形態(tài)，在內(nèi)存中進(jìn)行管理，從而提升運(yùn)行效率。

開發(fā)者可以通過該該示例的中方法調(diào)整 chat template，以關(guān)閉和開啟 thinking 模式，具體方式可以參考官方文檔（https://huggingface.co/tencent/Hunyuan-4B-Instruct）。由于目前 OpenVINOTM Tokenizer 還沒有完全支持 Hunyuan-7B-Instruct 模型默認(rèn)的 chat template 格式，因此我們需要手動(dòng)替換原始的 chat template，對其進(jìn)行簡化，具體方法如下：

chat 模式輸出結(jié)果示例：

關(guān)于該示例的后續(xù)更新，可以關(guān)注 OpenVINO notebooks 倉庫：https://github.com/openvinotoolkit/openvino_notebooks/tree/latest/notebooks/llm-chatbot

驅(qū)動(dòng)人生應(yīng)用獲取方式：

驅(qū)動(dòng)人生 AIGC 助手 (https://www.160.com/aigc/index.html)

英特爾 AIPC 應(yīng)用專區(qū) (intel.cn/aipc)

1.通過使用 OpenVINO 框架版本 2025.2.0 在英特爾? 酷睿?Ultra 7 258V 和英特爾? 酷睿?Ultra 9 285H 上進(jìn)行測試獲得了性能數(shù)據(jù)，計(jì)算過程發(fā)生在 iGPU 或 NPU 上。測試評估了首 Token 的延遲以及在 int4-mixed、int4-mixed-cw-sym 和 fp16 精度設(shè)置下 1K 輸入的平均吞吐量。每項(xiàng)測試在預(yù)熱階段后執(zhí)行三次，并選擇平均值作為報(bào)告數(shù)據(jù)。

性能因使用方式、配置和其他因素而異。請?jiān)L問 www.Intel.com/PerformanceIndex 了解更多信息。

性能結(jié)果基于測試時(shí)的配置狀態(tài)，可能未反映所有公開可用的更新內(nèi)容。請參閱相關(guān)文檔以獲取配置詳情。沒有任何產(chǎn)品或組件能夠保證絕對安全。

您的實(shí)際成本和結(jié)果可能會(huì)有所不同。

相關(guān)英特爾技術(shù)可能需要啟用相關(guān)硬件、軟件或激活服務(wù)。

本文鏈接：http://www.rrqrq.com/showinfo-26-175842-0.html英特爾 OpenVINO 賦能騰訊混元大模型，酷睿 Ultra Day0 適配

聲明：本網(wǎng)頁內(nèi)容旨在傳播知識，若有侵權(quán)等問題請及時(shí)與本網(wǎng)聯(lián)系，我們將在第一時(shí)間刪除處理。郵件：2376512515@qq.com

上一篇：廣域銘島的工業(yè) AI 精準(zhǔn)決策三要素：實(shí)時(shí)數(shù)據(jù)、機(jī)理模型與反饋機(jī)制

下一篇：微算法科技 (NASDAQ：MLGO) 基于量子重加密技術(shù)構(gòu)建區(qū)塊鏈數(shù)據(jù)共享解決方案

標(biāo)簽：

熱門焦點(diǎn)

K60至尊版剛預(yù)熱一加Ace2 Pro正面硬剛

Redmi這邊剛?cè)缁鹑巛钡男麄髁薑60 Ultra的各種技術(shù)和硬件配置，作為競品的一加也坐不住了。一加中國區(qū)總裁李杰發(fā)布了兩條微博，表示在自家的一加Ace2上早就已經(jīng)采用了和PixelWo
7月安卓手機(jī)性價(jià)比榜：努比亞+紅魔兩款新機(jī)入榜

7月登場的新機(jī)有努比亞Z50S Pro和紅魔8S Pro，除了三星之外目前唯二的兩款搭載超頻版驍龍8Gen2處理器的產(chǎn)品，而且努比亞和紅魔也一貫有著不錯(cuò)的性價(jià)比，所以在本次的性價(jià)比榜單
一加首款折疊屏！一加Open渲染圖出爐：罕見單手可握小尺寸

8月5日消息，此前就有爆料稱，一加首款折疊屏手機(jī)將會(huì)在第三季度上市，如今隨著時(shí)間臨近，新機(jī)的各種消息也開始浮出水面。據(jù)悉，這款新機(jī)將會(huì)被命名為“On
Java NIO內(nèi)存映射文件：提高文件讀寫效率的優(yōu)秀實(shí)踐！

Java的NIO庫提供了內(nèi)存映射文件的支持，它可以將文件映射到內(nèi)存中，從而可以更快地讀取和寫入文件數(shù)據(jù)。本文將對Java內(nèi)存映射文件進(jìn)行詳細(xì)的介紹和演示。內(nèi)存映射文件概述內(nèi)存
共享單車的故事講到哪了？

來源丨海克財(cái)經(jīng)與共享充電寶相差不多，共享單車已很久沒有被國內(nèi)熱點(diǎn)新聞關(guān)照到了。除了一再漲價(jià)和用戶直呼用不起了。近日多家媒體再發(fā)報(bào)道稱，成都、天津、鄭州等地多個(gè)共享單
阿里大調(diào)整

來源：產(chǎn)品劉有媒體報(bào)道稱，近期淘寶天貓集團(tuán)啟動(dòng)了近年來最大的人力制度改革，涉及員工績效、層級體系等多個(gè)核心事項(xiàng)，目前已形成一個(gè)初步的“征求意見版”：1、取消P序列
三星顯示已開始為AR設(shè)備研發(fā)硅基LED微顯示屏

7月18日消息，據(jù)外媒報(bào)道，隨著蘋果首款頭顯產(chǎn)品Vision Pro在6月份正式推出，AR/VR/MR等頭顯產(chǎn)品也就將成為各大公司下一個(gè)重要的競爭領(lǐng)域，對顯示屏這一關(guān)
聯(lián)想的ThinkBook Plus下一版曝光，鍵盤旁邊塞個(gè)平板

ThinkBook Plus 是聯(lián)想的一個(gè)特殊筆記本類別，它在封面放入了一塊墨水屏，也給人留下了較為深刻的印象。據(jù)有人爆料，聯(lián)想的下一款 ThinkBook Plus 可能更特殊，它
2021中國國際消費(fèi)電子博覽會(huì)與青島國際軟件融合創(chuàng)新博覽會(huì)新聞發(fā)布會(huì)隆重舉行

9月18日，2021中國國際消費(fèi)電子博覽會(huì)與青島國際軟件融合創(chuàng)新博覽會(huì)新聞發(fā)布會(huì)在青島國際新聞中心隆重舉行。發(fā)布會(huì)上青島市政府領(lǐng)導(dǎo)聯(lián)袂出席，對本次雙展會(huì)情

国产精品嫩草99av在线_一区在线视频观看_欧美高清一区_欧美日韩国产一区_99精品欧美一区二区三区_久久大香伊蕉在人线观看热2_一色屋精品视频在线观看网站_在线亚洲国产精品网站_亚洲区一区二区三区_你懂的视频一区二区

英特爾 OpenVINO 賦能騰訊混元大模型，酷睿 Ultra Day0 適配

K60至尊版剛預(yù)熱一加Ace2 Pro正面硬剛

7月安卓手機(jī)性價(jià)比榜：努比亞+紅魔兩款新機(jī)入榜

一加首款折疊屏！一加Open渲染圖出爐：罕見單手可握小尺寸

Java NIO內(nèi)存映射文件：提高文件讀寫效率的優(yōu)秀實(shí)踐！

共享單車的故事講到哪了？

阿里大調(diào)整

三星顯示已開始為AR設(shè)備研發(fā)硅基LED微顯示屏

聯(lián)想的ThinkBook Plus下一版曝光，鍵盤旁邊塞個(gè)平板

2021中國國際消費(fèi)電子博覽會(huì)與青島國際軟件融合創(chuàng)新博覽會(huì)新聞發(fā)布會(huì)隆重舉行

最新推薦

猜你喜歡

熱門推薦

相關(guān)資訊