VACE:阿里通义Wan团队推出的视频生成与编辑统一模型

VACE是什么?

VACE(Video Creation and Editing)是由阿里巴巴通义实验室推出的一站式ai视频生成与编辑统一模型,可以通过统一的模型架构实现多种视频创作和编辑任务。它能用一段文本或图片生成视频,也能对现有视频进行风格转换、修复或扩展。它把多种功能集成在一个模型里,操作方便,适合做创意视频或修复老视频。

VACE核心功能

视频生成:

  • 文本到视频生成:根据文本提示生成视频。

  • 参考到视频生成:结合文本和参考图像生成视频。

  • 视频扩展:基于现有视频片段生成新的开头或结尾。

视频编辑:

  • 视频到视频编辑:对输入视频进行整体风格转换(如色彩化、风格化)。

  • 遮罩视频编辑:在指定区域进行编辑,如修复(Inpainting)、扩展(Outpainting)。

  • 主体移除与重建:移除视频中的特定主体并填充背景。

任务组合:

  • 支持多种任务的灵活组合,例如参考生成+主体替换、姿态控制+视频扩展。

VACE技术原理

  • Video Condition Unit(VCU):将文本、图像、视频和遮罩等多种模态输入整合为统一的条件单元,支持多种任务的灵活组合。

  • Context Adapter结构:通过时间和空间维度的形式化表示,将不同任务的概念注入模型,使其能够适应不同的任务需求。

  • 扩散模型:基于扩散模型(如Diffusion Transformer)构建,通过逐步去噪的方式生成高质量的视频内容。

VACE技术原理.webp

VACE优势

  • 统一框架:将视频生成和编辑任务整合到一个模型中,减少了任务切换的复杂性。

  • 高效性:在多种任务上达到与特定任务模型相当的性能。

  • 多样性:支持多种任务组合,为视频内容创作提供了更广泛的应用可能性。

VACE应用场景

  • 创意视频生成:快速根据文本或图片生成广告、动画等创意视频内容。

  • 视频修复与增强:修复老视频、填补画面缺失部分或提升视频风格。

  • 高效视频编辑:实现主体替换、动画添加等复杂编辑任务。

  • 视频扩展:为短视频生成新片段,延长视频内容。

  • 互动视频创作:根据用户输入(如姿态、草图)生成个性化视频。

项目资源

项目官网:https://ali-vilab.github.io/VACE-Page/

GitHub仓库:https://github.com/ali-vilab/VACE

技术论文:https://arxiv.org/pdf/2503.07598

收藏
最新工具
Coze on WeChat
Coze on WeChat

一个基于微信平台开发的智能助手,主要对接 Coze 平台,支持大...

Maple Mono
Maple Mono

一款专注于优化编码体验的开源等宽字体,它提供无限的字体粗细和手工...

绘蛙AI多图成片
绘蛙AI多图成片

阿里巴巴推出的一款AI图生视频工具,只需上传2-4张连贯的图片并...

ManusAI
ManusAI

全球首款通用型AI智能体,ManusAI通过自主任务执行、动态任...

LLM Engineer Toolkit
LLM Engineer Toolkit

一个精心整理的LLM工具库,它将120多个与LLM相关的库按照功...

独角兽翻译器
独角兽翻译器

一款功能强大的跨境私域管理营销工具,通过实时翻译、多平台账号管理...

吐司AI-智能消除
吐司AI-智能消除

一款免费在线消除笔工具,通过利用AI技术帮助用户快速去除照片中的...

Alice
Alice

一个基于ICP的自主AI代理,Alice通过利用大型语言模型如D...

AingDesk
AingDesk

一款简单好用的AI助手,可以简化AI模型的本地部署和管理,支持多...

SumBuddy
SumBuddy

一款浏览器AI阅读助手,能快速总结网页内容并基于此进行对话。你还...