VACE:阿里通义Wan团队推出的视频生成与编辑统一模型

VACE是什么?

VACE(Video Creation and Editing)是由阿里巴巴通义实验室推出的一站式ai视频生成与编辑统一模型,可以通过统一的模型架构实现多种视频创作和编辑任务。它能用一段文本或图片生成视频,也能对现有视频进行风格转换、修复或扩展。它把多种功能集成在一个模型里,操作方便,适合做创意视频或修复老视频。

VACE核心功能

视频生成:

  • 文本到视频生成:根据文本提示生成视频。

  • 参考到视频生成:结合文本和参考图像生成视频。

  • 视频扩展:基于现有视频片段生成新的开头或结尾。

视频编辑:

  • 视频到视频编辑:对输入视频进行整体风格转换(如色彩化、风格化)。

  • 遮罩视频编辑:在指定区域进行编辑,如修复(Inpainting)、扩展(Outpainting)。

  • 主体移除与重建:移除视频中的特定主体并填充背景。

任务组合:

  • 支持多种任务的灵活组合,例如参考生成+主体替换、姿态控制+视频扩展。

VACE技术原理

  • Video Condition Unit(VCU):将文本、图像、视频和遮罩等多种模态输入整合为统一的条件单元,支持多种任务的灵活组合。

  • Context Adapter结构:通过时间和空间维度的形式化表示,将不同任务的概念注入模型,使其能够适应不同的任务需求。

  • 扩散模型:基于扩散模型(如Diffusion Transformer)构建,通过逐步去噪的方式生成高质量的视频内容。

VACE技术原理.webp

VACE优势

  • 统一框架:将视频生成和编辑任务整合到一个模型中,减少了任务切换的复杂性。

  • 高效性:在多种任务上达到与特定任务模型相当的性能。

  • 多样性:支持多种任务组合,为视频内容创作提供了更广泛的应用可能性。

VACE应用场景

  • 创意视频生成:快速根据文本或图片生成广告、动画等创意视频内容。

  • 视频修复与增强:修复老视频、填补画面缺失部分或提升视频风格。

  • 高效视频编辑:实现主体替换、动画添加等复杂编辑任务。

  • 视频扩展:为短视频生成新片段,延长视频内容。

  • 互动视频创作:根据用户输入(如姿态、草图)生成个性化视频。

项目资源

项目官网:https://ali-vilab.github.io/VACE-Page/

GitHub仓库:https://github.com/ali-vilab/VACE

技术论文:https://arxiv.org/pdf/2503.07598

收藏
最新工具
MovieGame
MovieGame

一个电影爱好者做的个人网站,玩家通过看电影截图来猜电影片名,网站...

汉兜
汉兜

一款汉字版的Wordle游戏,基于流行的英文猜词游戏Wordle...

Gempix2 AI
Gempix2 AI

一款集生成和编辑图像于一体的的AI图像生成工具,提供包括文本转图...

极像素
极像素

一个展示和探索超高像素全景图像的在线平台,能提供全球各地超高分辨...

Krunker.io
Krunker.io

一款免费的在线多人第一人称射击游戏,直接在网页就能玩。游戏玩法多...

转换云
转换云

一个在线音乐格式转换网站,包括.ncm、.mgg、.mflac、...

萝卜工坊
萝卜工坊

一个能把电子文本变成逼真手写风格的在线工具。它有AI专属字体制作...

LyricsPoster
LyricsPoster

一个帮你把喜欢的歌手图片和歌词做成海报的在线工具。你可以在简单的...

蓝豆打字
蓝豆打字

一个在线打字练习平台,提供键盘指法、拼音、双拼、五笔、源代码、英...

一页纸EasyPaper
一页纸EasyPaper

一个能生成自定义纸张的免费在线工具。通过网页界面,用户可自行设置...