當前位置：首頁 > 元宇宙 > AI

Stable Audio 2.5 企業(yè)級音頻生成 AI 模型發(fā)布，號稱“3 分鐘曲目 2 秒鐘完成”

來源：責編：時間：2025-09-17 11:35:20 55觀看

導讀 9 月 14 日消息，Stability AI 現(xiàn)已正式發(fā)布企業(yè)級音頻生成模型 Stable Audio 2.5，相對上一代主要圍繞音頻細節(jié)、生成速度方面進行提升，號稱“僅需 2 秒鐘即可創(chuàng)建 3 分鐘音頻曲目”。據(jù)介紹，Stable Audio 2.5 的

9 月 14 日消息，Stability AI 現(xiàn)已正式發(fā)布企業(yè)級音頻生成模型 Stable Audio 2.5，相對上一代主要圍繞音頻細節(jié)、生成速度方面進行提升，號稱“僅需 2 秒鐘即可創(chuàng)建 3 分鐘音頻曲目”。

據(jù)介紹，Stable Audio 2.5 的核心改進集中在音樂生成能力方面，號稱生成結(jié)果更加貼合實際編曲邏輯，可呈現(xiàn)前奏、發(fā)展與結(jié)尾等完整多段式結(jié)構(gòu)。同時新模型對提示詞的理解更為準確，尤其在情緒描述和音樂風格詞匯的把握上，響應更符合預期。

此外，新版模型還顯著改進了音頻生成速度，Stability AI 稱這主要得益于研發(fā)團隊提出的后訓練方法 ARC（注：Adversarial Relativistic-Contrastive），這一技術(shù)通過結(jié)合相對式對抗訓練與對比判別器，加速擴散模型的生成過程，可在保證音軌質(zhì)量的同時顯著降低 GPU 推理耗時，從而實現(xiàn) 2 秒鐘生成長達 3 分鐘的音頻內(nèi)容。

除此之外，Stable Audio 2.5 還新增了音頻修補能力，用戶可以導入自己的音頻文件，并指定“延展位置”，模型即可根據(jù)音頻前后內(nèi)容及整體曲風，將音頻一鍵“延長”，特別適合剪輯等場景。

目前，Stable Audio 2.5 已可通過 StableAudio 官網(wǎng)直接試用，同時支持本地化部署。不過官方規(guī)定，用戶上傳的音頻文件不得包含受版權(quán)保護的內(nèi)容，StableAudio 網(wǎng)站將利用自帶的內(nèi)容識別系統(tǒng)進行檢測，以確保不侵犯他人版權(quán)。

本文鏈接：http://www.rrqrq.com/showinfo-45-27646-0.htmlStable Audio 2.5 企業(yè)級音頻生成 AI 模型發(fā)布，號稱“3 分鐘曲目 2 秒鐘完成”

聲明：本網(wǎng)頁內(nèi)容旨在傳播知識，若有侵權(quán)等問題請及時與本網(wǎng)聯(lián)系，我們將在第一時間刪除處理。郵件：2376512515@qq.com

上一篇：全國首位機器人博士生“學霸 01”完成上海戲劇學院“新生入學報到”，將接受“藝術(shù)與科技雙導師指導”

下一篇： OpenAI GPT-5 擁有博士級能力？谷歌 DeepMind CEO：無稽之談

標簽：

熱門焦點

從科幻走進現(xiàn)實，元宇宙概念逐漸清晰

2021年，元宇宙概念如同一顆炸彈投進互聯(lián)網(wǎng)行業(yè)，掀起了一場數(shù)字海嘯，眾多企業(yè)紛紛入局，在此新領(lǐng)域展開新探索。那么，加速狂奔的元宇宙究竟是什么？概念翻紅，元宇宙走進資本圈2021年3
元宇宙火熱的當下，我們該如何“身臨其境”的體驗元宇宙？

元宇宙的余熱依然沒有過去，甚至大有星星之火開啟燎原之勢，元宇宙本身也從殿堂走向了民間，我們可以看到一些企業(yè)開始了元宇宙的探索，諸如中國電信全資控股子公司天
韓國主權(quán)基金增加對硅谷初創(chuàng)公司投資押注元宇宙和人工智能

韓國投資公司(KIC)CEO Seoungho Jin預計，該公司在舊金山的辦事處今年將擴招人手，探索在硅谷投資科技、健康和綠色項目。規(guī)模高達2000億美元的韓國主權(quán)財富基金—
“元宇宙第一股”Roblox緣何被資本市場看“低”？

近期，冬奧會的召開受到廣泛關(guān)注，而吉祥物冰墩墩也成為新晉“頂流”，“一墩難求”成為普遍心聲，為了滿足大眾需求，nWayPlay平臺曾在2月12日發(fā)售了一款由國際奧委會官
冰墩墩的NFT暴漲千倍？真相則是價格暴跌、成交遇冷

《區(qū)塊鏈日報》記者查證，近日來冰墩墩數(shù)字藏品交易數(shù)量出現(xiàn)大幅下滑，而所謂的暴漲千倍更是有價無市的自嗨。昨日，北京冬奧會正式閉幕。在這屆冬奧會上，吉祥物“冰
想進入web3.0？來看看哪些工作適合你

隨著對加密貨幣需求的增加，加密領(lǐng)域的工作的數(shù)量也在增加。以下是一些非技術(shù)性加密貨幣工作簡介。加密貨幣在主流市場獲得的可信度提升。導致區(qū)塊鏈領(lǐng)域的求職
頭像類NFTs的統(tǒng)治能持續(xù)多久？

在過去的一兩年里，NFTs在互聯(lián)網(wǎng)世界中掀起了一場風暴。今天，當我們想到NFTs時，我們主要想到的是那些充斥著我們的社交媒體屏幕的數(shù)字卡通--無聊猿、punks 和介于
利用元宇宙平臺10天收入160萬，風口還是虎口？

美國Meta平臺有限公司，也就是原來的臉書公司，9日宣布，公司旗下的虛擬現(xiàn)實應用《地平線世界》正式向美國和加拿大的18歲以上人群開放。這也是目前Meta推出的最具象
NFT高玩必備：NFT分析工具大盤點

NFT市場的火熱讓越來越多的投資者投身其中，但當前的 NFT 生態(tài)系統(tǒng)存在幾個問題卻困擾了大多數(shù)人，如難以準確評估 NFT 項目的資產(chǎn)價格、缺乏 NFT 市場動態(tài)信息、

国产精品嫩草99av在线_一区在线视频观看_欧美高清一区_欧美日韩国产一区_99精品欧美一区二区三区_久久大香伊蕉在人线观看热2_一色屋精品视频在线观看网站_在线亚洲国产精品网站_亚洲区一区二区三区_你懂的视频一区二区

首頁

元宇宙

NFT

區(qū)塊鏈

虛擬人

AR/VR

AI

元宇宙百科

Stable Audio 2.5 企業(yè)級音頻生成 AI 模型發(fā)布，號稱“3 分鐘曲目 2 秒鐘完成”

從科幻走進現(xiàn)實，元宇宙概念逐漸清晰

元宇宙火熱的當下，我們該如何“身臨其境”的體驗元宇宙？

韓國主權(quán)基金增加對硅谷初創(chuàng)公司投資押注元宇宙和人工智能

“元宇宙第一股”Roblox緣何被資本市場看“低”？

冰墩墩的NFT暴漲千倍？真相則是價格暴跌、成交遇冷

想進入web3.0？來看看哪些工作適合你

頭像類NFTs的統(tǒng)治能持續(xù)多久？

利用元宇宙平臺10天收入160萬，風口還是虎口？

NFT高玩必備：NFT分析工具大盤點

最新推薦

聚焦虛擬數(shù)字人技術(shù)，這三大商機要抓住！

上、中、下游加深融合，搭建元宇宙產(chǎn)業(yè)全景

Meta正在研發(fā)元宇宙語音助手；廣東省462家企業(yè)申請元宇宙商標

頭頂光環(huán)無數(shù)卻估值極低，以太坊這位&——quot;最強殺手&——quot;有望涅槃重生？

對諷刺無動于衷，Nori將碳市場放在區(qū)塊鏈上

Staking 收益翻倍？

猜你喜歡

熱門推薦

相關(guān)資訊