VACE:阿里通义Wan团队推出的视频生成与编辑统一模型

VACE是什么?

VACE(Video Creation and Editing)是由阿里巴巴通义实验室推出的一站式ai视频生成与编辑统一模型,可以通过统一的模型架构实现多种视频创作和编辑任务。它能用一段文本或图片生成视频,也能对现有视频进行风格转换、修复或扩展。它把多种功能集成在一个模型里,操作方便,适合做创意视频或修复老视频。

VACE核心功能

视频生成:

  • 文本到视频生成:根据文本提示生成视频。

  • 参考到视频生成:结合文本和参考图像生成视频。

  • 视频扩展:基于现有视频片段生成新的开头或结尾。

视频编辑:

  • 视频到视频编辑:对输入视频进行整体风格转换(如色彩化、风格化)。

  • 遮罩视频编辑:在指定区域进行编辑,如修复(Inpainting)、扩展(Outpainting)。

  • 主体移除与重建:移除视频中的特定主体并填充背景。

任务组合:

  • 支持多种任务的灵活组合,例如参考生成+主体替换、姿态控制+视频扩展。

VACE技术原理

  • Video Condition Unit(VCU):将文本、图像、视频和遮罩等多种模态输入整合为统一的条件单元,支持多种任务的灵活组合。

  • Context Adapter结构:通过时间和空间维度的形式化表示,将不同任务的概念注入模型,使其能够适应不同的任务需求。

  • 扩散模型:基于扩散模型(如Diffusion Transformer)构建,通过逐步去噪的方式生成高质量的视频内容。

VACE技术原理.webp

VACE优势

  • 统一框架:将视频生成和编辑任务整合到一个模型中,减少了任务切换的复杂性。

  • 高效性:在多种任务上达到与特定任务模型相当的性能。

  • 多样性:支持多种任务组合,为视频内容创作提供了更广泛的应用可能性。

VACE应用场景

  • 创意视频生成:快速根据文本或图片生成广告、动画等创意视频内容。

  • 视频修复与增强:修复老视频、填补画面缺失部分或提升视频风格。

  • 高效视频编辑:实现主体替换、动画添加等复杂编辑任务。

  • 视频扩展:为短视频生成新片段,延长视频内容。

  • 互动视频创作:根据用户输入(如姿态、草图)生成个性化视频。

项目资源

项目官网:https://ali-vilab.github.io/VACE-Page/

GitHub仓库:https://github.com/ali-vilab/VACE

技术论文:https://arxiv.org/pdf/2503.07598

收藏
最新工具
Chess Tempo
Chess Tempo

一个在线国际象棋训练平台。它的战术题库质量很高,后来又增加了多种...

DeeVid AI
DeeVid AI

一个用AI生成视频的工具。它能让没有技术基础的人,通过输入文字、...

Hole.io
Hole.io

一款由 Voodoo 出品的休闲竞技手游,核心玩法是“大洞吃小洞...

Monotype Fonts
Monotype Fonts

蒙纳字库做的企业字体订阅和管理平台,主打一站式解决用字问题。现在...

Flova AI
Flova AI

一个面向短片、广告、动画和社交媒体创作者的AI创作平台。它能把一...

Prosperous Universe
Prosperous Universe

Simulogics开发的一款硬核太空题材经济模拟经营类MMO游...

MediaCrawler
MediaCrawler

一个功能强大的多平台自媒体数据采集工具,支持小红书、抖音、快手、...

WeaveFox
WeaveFox

实现设计稿高精度转代码,它把 “设计稿还原 + 需求编码 + 部...

Narrow.One
Narrow.One

中世纪背景的多人网上射击游戏,主打弓箭对战和5v5团队竞技。Pe...

Slopeio.org
Slopeio.org

主打《Slope》快节奏跑酷游戏,这游戏是Y8 Studio做的...