當(dāng)前位置：首頁 > 元宇宙 > AI

一張圖即可生成電影級(jí)數(shù)字人視頻：阿里云通義萬相 Wan2.2-S2V 視頻生成模型宣布開源

來源：責(zé)編：時(shí)間：2025-08-29 08:49:29 34觀看

導(dǎo)讀 8 月 26 日消息，今日晚間，阿里云宣布開源全新多模態(tài)視頻生成模型通義萬相 Wan2.2-S2V，僅需一張靜態(tài)圖片和一段音頻，即可生成面部表情自然、口型一致、肢體動(dòng)作絲滑的電影級(jí)數(shù)字人視頻。據(jù)介紹，該模型單次生成的視

8 月 26 日消息，今日晚間，阿里云宣布開源全新多模態(tài)視頻生成模型通義萬相 Wan2.2-S2V，僅需一張靜態(tài)圖片和一段音頻，即可生成面部表情自然、口型一致、肢體動(dòng)作絲滑的電影級(jí)數(shù)字人視頻。

據(jù)介紹，該模型單次生成的視頻時(shí)長可達(dá)分鐘級(jí)，大幅提升數(shù)字人直播、影視制作、AI 教育等行業(yè)的視頻創(chuàng)作效率。

目前，Wan2.2-S2V 可驅(qū)動(dòng)真人、卡通、動(dòng)物、數(shù)字人等類型圖片，并支持肖像、半身以及全身等任意畫幅，上傳一段音頻后，模型就能讓圖片中的主體形象完成說話、唱歌和表演等動(dòng)作。

Wan2.2-S2V 還支持文本控制，輸入 Prompt 后還可對(duì)視頻畫面進(jìn)行控制，讓視頻主體的運(yùn)動(dòng)和背景的變化更豐富。

例如，上傳一張人物彈鋼琴的照片、一段歌曲和一段文字，Wan2.2-S2V 即可生成一段完整、聲情并茂的鋼琴演奏視頻，不僅能保證人物形象和原圖一致，其面部表情和嘴部動(dòng)作還能與音頻對(duì)齊，視頻人物的手指手型、力度、速度也能完美匹配音頻節(jié)奏。

據(jù)介紹，Wan2.2-S2V 采用了基于通義萬相視頻生成基礎(chǔ)模型能力，融合了文本引導(dǎo)的全局運(yùn)動(dòng)控制和音頻驅(qū)動(dòng)的細(xì)粒度局部運(yùn)動(dòng)，實(shí)現(xiàn)了復(fù)雜場景的音頻驅(qū)動(dòng)視頻生成；同時(shí)引入 AdaIN 和 CrossAttention 兩種控制機(jī)制，實(shí)現(xiàn)了更準(zhǔn)確更動(dòng)態(tài)的音頻控制效果；為保障長視頻生成效果，Wan2.2-S2V 通過層次化幀壓縮技術(shù)，大幅降低了歷史幀的 Token 數(shù)量，通過該方式將 motion frames (注：歷史參考幀) 的長度從數(shù)幀拓展到 73 幀，從而實(shí)現(xiàn)了穩(wěn)定的長視頻生成效果。

在模型訓(xùn)練上，通義團(tuán)隊(duì)構(gòu)建了超 60 萬個(gè)片段的音視頻數(shù)據(jù)集，通過混合并行訓(xùn)練進(jìn)行全參數(shù)化訓(xùn)練，充分挖掘了模型的性能。同時(shí)通過多分辨率訓(xùn)練、支持模型多分辨率的推理，可支持不同分辨率場景的視頻生成需求，如豎屏短視頻、橫屏影視劇。

實(shí)測數(shù)據(jù)顯示，Wan2.2-S2V 在 FID（視頻質(zhì)量，越低越好）、EFID（表情真實(shí)度，越低越好）、CSIM（身份一致性，越高越好）等核心指標(biāo)上取得了同類模型最好的成績。

阿里云表示，自今年 2 月以來，通義萬相已連續(xù)開源文生視頻、圖生視頻、首尾幀生視頻、全能編輯、音頻生視頻等多款模型，在開源社區(qū)和三方平臺(tái)的下載量已超 2000 萬。

開源地址：

GitHub：https://github.com/Wan-Video/Wan2.2

魔搭社區(qū)：https://www.modelscope.cn/ models / Wan-AI / Wan2.2-S2V-14B

HuggingFace:https://huggingface.co/Wan-AI/Wan2.2-S2V-14B

體驗(yàn)地址：

通義萬相官網(wǎng)：https://tongyi.aliyun.com/ wanxiang / generate

阿里云百煉：https://bailian.console.aliyun.com/?tab=api#/api/?type=model&url=2978215

本文鏈接：http://www.rrqrq.com/showinfo-45-27068-0.html一張圖即可生成電影級(jí)數(shù)字人視頻：阿里云通義萬相 Wan2.2-S2V 視頻生成模型宣布開源

聲明：本網(wǎng)頁內(nèi)容旨在傳播知識(shí)，若有侵權(quán)等問題請(qǐng)及時(shí)與本網(wǎng)聯(lián)系，我們將在第一時(shí)間刪除處理。郵件：2376512515@qq.com

上一篇： ChatGPT 被指導(dǎo)致美國一名 16 歲少年自殺：未有效干預(yù)且起到“教學(xué)”作用

下一篇：智能門鎖線上均價(jià)持續(xù)走低，2025年前七月已降至879元

標(biāo)簽：

熱門焦點(diǎn)

一份全面清單：Web3行業(yè)高薪酬的13種工作

來源：區(qū)塊鏈騎士這可能會(huì)讓許多人感到震驚，但除了成為開發(fā)人員之外，Web3還有其他高薪工作。Web3可能是現(xiàn)代就業(yè)市場中跨學(xué)科最多的領(lǐng)域，換句話說，它由許多個(gè)在不同領(lǐng)域中具有不同
內(nèi)容行業(yè)大變天，爆款全靠AI？

出品 | 微果醬（wjam123456）作者 | 陳出木題圖 | 文心一格 AI的發(fā)展之快出乎所有人的預(yù)料，似乎一夜之間便呼嘯而來。無論是資本的風(fēng)向標(biāo)，抑或是生活工作的輔助、流量口，還是茶余飯
中國虛擬數(shù)字人如何橫向拓展市場需求，探索發(fā)展場景?

通過5G、AI等新技術(shù)更新?lián)Q代，虛擬數(shù)字人為諸多下游行業(yè)帶來新的發(fā)展機(jī)會(huì)。虛擬數(shù)字人技術(shù)以其簡化性和精品性持續(xù)拓展泛娛樂、金融、教育、政務(wù)、醫(yī)療、零售等
“我沒搞懂元宇宙，但一天能賺9w塊”

作者：鄭宇軒最近幾個(gè)月，“元宇宙”爆火，除了 Facebook 改名為 Meta 高調(diào)進(jìn)軍元宇宙外， BAT 為代表的大廠紛紛著手“元宇宙”新業(yè)務(wù)。剎那之間，元宇宙成為新風(fēng)口，除了
本周NFT領(lǐng)域重要資訊回顧

NFT在蘇富比拍賣是一波三折的嗎？其實(shí)不完全如此，但本周在蘇富比拍賣行發(fā)生了一系列有趣的事。與此同時(shí)，美聯(lián)社因其最新的NFT銷售被推到了風(fēng)口浪尖，而Opensea正面臨
扎克伯格演示了一種“造物主”式的元宇宙語音機(jī)器人工具

前身為Facebook的Meta公司今天展示了一個(gè)人工智能系統(tǒng)的Demo，該系統(tǒng)使人們能夠通過語音命令生成或?qū)胩摂M世界中的事物。該公司認(rèn)為這個(gè)被稱為 "Builder Bot "
又一家數(shù)字營銷公司入局元宇宙，國內(nèi)首個(gè)藝術(shù)元宇宙社區(qū)“Meta彼岸”上線

作者：董宇佳2月28日，智度股份在北京舉辦產(chǎn)品發(fā)布會(huì)，宣布其與國光電器聯(lián)手打造的國內(nèi)首個(gè)藝術(shù)元宇宙社區(qū)——“Meta彼岸”在VR端和移動(dòng)端正式公測。從科技巨頭布局
HTC Vive推出元宇宙平臺(tái)Viverse；騰訊投資小米生態(tài)鏈AR眼鏡廠商

今日熱點(diǎn)：HTC Vive正式推出元宇宙平臺(tái)Viverse；騰訊投資小米生態(tài)鏈AR眼鏡廠商北京蜂巢科技；面部追蹤和眼動(dòng)追蹤是Quest下一版本的“重點(diǎn)”；索尼PSVR 2將推遲至2023
你連元宇宙都不知道嗎？快來看看這四本元宇宙書籍吧

前有騰訊、阿里申請(qǐng)商標(biāo)注冊(cè)，后有Facebook宣布改名，若論當(dāng)前互聯(lián)網(wǎng)最火最熱的概念，當(dāng)屬“元宇宙”。“阿里元宇宙”“淘寶元宇宙”“釘釘元宇宙”“QQ元宇宙”“

国产精品嫩草99av在线_一区在线视频观看_欧美高清一区_欧美日韩国产一区_99精品欧美一区二区三区_久久大香伊蕉在人线观看热2_一色屋精品视频在线观看网站_在线亚洲国产精品网站_亚洲区一区二区三区_你懂的视频一区二区

首頁

元宇宙

NFT

區(qū)塊鏈

虛擬人

AR/VR

AI

元宇宙百科

一張圖即可生成電影級(jí)數(shù)字人視頻：阿里云通義萬相 Wan2.2-S2V 視頻生成模型宣布開源

一份全面清單：Web3行業(yè)高薪酬的13種工作

內(nèi)容行業(yè)大變天，爆款全靠AI？

中國虛擬數(shù)字人如何橫向拓展市場需求，探索發(fā)展場景?

“我沒搞懂元宇宙，但一天能賺9w塊”

本周NFT領(lǐng)域重要資訊回顧

扎克伯格演示了一種“造物主”式的元宇宙語音機(jī)器人工具

又一家數(shù)字營銷公司入局元宇宙，國內(nèi)首個(gè)藝術(shù)元宇宙社區(qū)“Meta彼岸”上線

HTC Vive推出元宇宙平臺(tái)Viverse；騰訊投資小米生態(tài)鏈AR眼鏡廠商

你連元宇宙都不知道嗎？快來看看這四本元宇宙書籍吧

最新推薦

數(shù)字人的新革命，BAT的“沖高”戰(zhàn)場

【東方證券】虛擬世界照進(jìn)現(xiàn)實(shí)，元宇宙中有什么？ | 元宇宙Meta洞見

保時(shí)捷推出虛擬超跑，車企元宇宙營銷這么香？

元宇宙是推動(dòng)NFT發(fā)展的初始家園

Meta正在研發(fā)元宇宙語音助手；廣東省462家企業(yè)申請(qǐng)?jiān)钪嫔虡?biāo)

為什么元宇宙將永遠(yuǎn)改變體育和你的生活？

猜你喜歡

熱門推薦

相關(guān)資訊