快科技12月7日消息,日前NVIDIA正式推出了CUDA 13.1,官方將其定位為“自2006年CUDA平臺誕生以來大、全面的升級”。
此次更新的核心亮點,是引入了革命性的CUDA Tile編程模型,標(biāo)志著GPU編程范式邁入一個新的、更高抽象的階段。

傳統(tǒng)的GPU編程基于SIMT (單指令多線程) 模式,開發(fā)者需要關(guān)注線程、內(nèi)存和同步等底層細(xì)節(jié)。
而CUDA Tile是一種基于tile(瓦片、數(shù)據(jù)塊)的模型,開發(fā)者現(xiàn)在可以專注于將數(shù)據(jù)組織成塊,并對這些數(shù)據(jù)塊執(zhí)行計算,而底層的線程調(diào)度、內(nèi)存布局以及硬件資源映射等復(fù)雜工作,將由編譯器和運(yùn)行時自動處理。
為支持Tile編程,CUDA 13.1引入了虛擬指令集(Tile IR),并配套發(fā)布了cuTile工具,允許開發(fā)者使用Python來編寫基于Tile的GPU Kernel。
這極大地降低了GPU編程的門檻,使得不熟悉傳統(tǒng)CUDA C/C++或底層SIMT模型的數(shù)據(jù)科學(xué)家和研究者也能編寫GPU加速代碼。
Tile編程并非取代SIMT,而是提供了一個并存的可選路徑,開發(fā)者可根據(jù)具體應(yīng)用場景,靈活選擇合適的編程模型。
CUDA 13.1的意義,不僅在于新增功能或優(yōu)化性能,更在于為構(gòu)建新一代高層、跨架構(gòu)的GPU計算庫和框架奠定了基礎(chǔ),通過引入Tile IR和高層抽象,NVIDIA在硬件和軟件之間增加了一個更厚的中間層。
過去,競爭對手(如AMD的ROCm、Intel的OneAPI)主要依賴兼容層進(jìn)行CUDA代碼轉(zhuǎn)譯,但對于CUDA Tile這種更高抽象的新模式,單純的代碼轉(zhuǎn)譯已遠(yuǎn)不足夠。
競爭對手必須構(gòu)建同樣智能的編譯器來處理Tile IR,這無疑增加了技術(shù)對齊的難度,客觀上進(jìn)一步提升了CUDA生態(tài)系統(tǒng)的粘性和用戶鎖定度。

本文鏈接:http://www.rrqrq.com/showinfo-24-186667-0.htmlNVIDIA護(hù)城河20年來大更新!CUDA 13.1正式發(fā)布
聲明:本網(wǎng)頁內(nèi)容旨在傳播知識,若有侵權(quán)等問題請及時與本網(wǎng)聯(lián)系,我們將在第一時間刪除處理。郵件:2376512515@qq.com