VACE:阿里通义Wan团队推出的视频生成与编辑统一模型

VACE是什么?

VACE(Video Creation and Editing)是由阿里巴巴通义实验室推出的一站式ai视频生成与编辑统一模型,可以通过统一的模型架构实现多种视频创作和编辑任务。它能用一段文本或图片生成视频,也能对现有视频进行风格转换、修复或扩展。它把多种功能集成在一个模型里,操作方便,适合做创意视频或修复老视频。

VACE核心功能

视频生成:

  • 文本到视频生成:根据文本提示生成视频。

  • 参考到视频生成:结合文本和参考图像生成视频。

  • 视频扩展:基于现有视频片段生成新的开头或结尾。

视频编辑:

  • 视频到视频编辑:对输入视频进行整体风格转换(如色彩化、风格化)。

  • 遮罩视频编辑:在指定区域进行编辑,如修复(Inpainting)、扩展(Outpainting)。

  • 主体移除与重建:移除视频中的特定主体并填充背景。

任务组合:

  • 支持多种任务的灵活组合,例如参考生成+主体替换、姿态控制+视频扩展。

VACE技术原理

  • Video Condition Unit(VCU):将文本、图像、视频和遮罩等多种模态输入整合为统一的条件单元,支持多种任务的灵活组合。

  • Context Adapter结构:通过时间和空间维度的形式化表示,将不同任务的概念注入模型,使其能够适应不同的任务需求。

  • 扩散模型:基于扩散模型(如Diffusion Transformer)构建,通过逐步去噪的方式生成高质量的视频内容。

VACE技术原理.webp

VACE优势

  • 统一框架:将视频生成和编辑任务整合到一个模型中,减少了任务切换的复杂性。

  • 高效性:在多种任务上达到与特定任务模型相当的性能。

  • 多样性:支持多种任务组合,为视频内容创作提供了更广泛的应用可能性。

VACE应用场景

  • 创意视频生成:快速根据文本或图片生成广告、动画等创意视频内容。

  • 视频修复与增强:修复老视频、填补画面缺失部分或提升视频风格。

  • 高效视频编辑:实现主体替换、动画添加等复杂编辑任务。

  • 视频扩展:为短视频生成新片段,延长视频内容。

  • 互动视频创作:根据用户输入(如姿态、草图)生成个性化视频。

项目资源

项目官网:https://ali-vilab.github.io/VACE-Page/

GitHub仓库:https://github.com/ali-vilab/VACE

技术论文:https://arxiv.org/pdf/2503.07598

收藏
最新工具
AI Short
AI Short

一个提示词管理和分享平台,可以用在不同模型上。提供一键复制或发送...

City-Roads
City-Roads

一个专门用来画城市道路网的免费开源工具。它用 OpenStree...

DropMagic AI
DropMagic AI

一个快速搭建高转化率Shopify店铺的AI工具,它可以把任意商...

RemoveHandWriting
RemoveHandWriting

一个能去掉手写内容的工具。它能帮用户把图片和 PDF 里的手写笔...

汉语拼音网
汉语拼音网

主要介绍汉语拼音基础知识,包含23个声母、24个韵母、16个整体...

MvpFast
MvpFast

给独立开发者或小团队用的商业化全栈模板,让“有产品想法到上线赚钱...

Codebox.Club
Codebox.Club

免费的智能二维码生成工具,功能比较全。能做 URL、WiFi、文...

LogoCook
LogoCook

一个免费的在线Logo生成器。选个模板,调一下颜色、字体、图标这...

Cardify卡片工坊
Cardify卡片工坊

一个能用Markdown做出好看知识卡片的工具。它有 30 多种...

FliiipBook
FliiipBook

一个可以在网页上使用的简单GIF动画制作工具。最适合在桌面电脑或...