8 月 7 日消息,通義千問(wèn) Qwen 昨日(8 月 6 日)發(fā)布公告,宣布,推出 Qwen3-4B-Instruct-2507 和 Qwen3-4B-Thinking-2507 兩個(gè)模型,大幅提升性能。
官方表示,SLM(Small Language Models)對(duì) Agentic AI 的發(fā)展極具價(jià)值,“2507”版本的 Qwen3-4B 模型,體積小,性能強(qiáng),對(duì)手機(jī)等端側(cè)硬件部署尤為友好。

援引博文介紹,在非推理(non-thinking)領(lǐng)域,Qwen3-4B-Instruct-2507 顯著提升通用能力,目標(biāo)成為更全能的端側(cè)利器。
該模型掌握更多語(yǔ)言和長(zhǎng)尾知識(shí),上下文理解擴(kuò)展至 256K,小模型也能處理長(zhǎng)文本。該模型通用能力超越了閉源的小尺寸模型 GPT-4.1-nano,性能接近等規(guī)模的 Qwen3-30B-A3B(non-thinking)。
官方表示該模型更像一位高效的“執(zhí)行專家”,遵循指令、迅速響應(yīng),更適合用于內(nèi)容創(chuàng)作、工具調(diào)用等。
在推理(thinking)領(lǐng)域,Qwen3-4B-Thinking-2507 大幅提升了推理能力,AIME25 高達(dá) 81.3 分。Qwen3-4B-Thinking-2507 的推理表現(xiàn)可媲美中等模型 Qwen3-30B-Thinking,在聚焦數(shù)學(xué)能力的 AIME25 測(cè)評(píng)中,以 4B 參數(shù)量斬獲驚人的 81.3 分的好成績(jī)。

官方表示該模型像一位嚴(yán)謹(jǐn)?shù)摹皩W(xué)術(shù)專家”,面對(duì)復(fù)雜問(wèn)題逐步推理,完成任務(wù)更深入可靠。

本文鏈接:http://www.rrqrq.com/showinfo-45-25981-0.html阿里通義千問(wèn) Qwen3-4B-2507 雙料更新:手機(jī)也能輕松跑,AI 體積小、性能強(qiáng)
聲明:本網(wǎng)頁(yè)內(nèi)容旨在傳播知識(shí),若有侵權(quán)等問(wèn)題請(qǐng)及時(shí)與本網(wǎng)聯(lián)系,我們將在第一時(shí)間刪除處理。郵件:2376512515@qq.com
上一篇: 谷歌 Jules 正式上線:14 萬(wàn)處代碼優(yōu)化,打造最佳 AI 寫(xiě)代碼助手
下一篇: 面壁智能開(kāi)源 MiniCPM-V 4.0 AI 模型:手機(jī) App 就能用,圖像理解超 GPT-4.1-mini