MagicTryOn:浙江大学和vivo推出的开源视频虚拟试穿项目

MagicTryOn是什么?

MagicTryOn 是浙江大学和 vivo 合作推出的开源视频虚拟试穿项目。它用视频扩散 Transformer 的 DiT 架构,让服装试穿看起来更真实、更稳当。这个项目靠全自注意力机制,保证视频各帧连贯,不会像老方法那样出现闪烁、抖动。它的主要功能有:精准保留服装细节,通过多条件引导生成更真实的试穿效果,还用掩码感知损失提升生成质量。在多个数据集上,MagicTryOn 表现很好,视觉质量和泛化能力都很强。

MagicTryOn:浙江大学和vivo推出的开源视频虚拟试穿项目.webp

MagicTryOn技术原理

  • 扩散 Transformer(DiT)架构:该架构模块化设计允许更灵活地注入条件信息,多级服装特征能有效整合到去噪过程中。其内置的全自注意力机制可联合建模视频的时空一致性,捕捉帧内局部细节和帧间动态变化。

  • 粗到细的服装保持策略:粗策略是在嵌入阶段,将服装标记注入输入标记序列,扩展旋转位置编码的网格大小,让服装标记和输入标记共享一致的位置编码;细策略是在去噪阶段,引入语义引导交叉注意力和特征引导交叉注意力模块,提供细粒度的服装细节引导。

  • 掩码感知损失(Mask-Aware Loss):基于此损失,模型能更专注于服装区域的生成,提高服装区域的细节保真度和整体合成结果的真实感。

MagicTryOn技术原理.webp

MagicTryOn主要功能

  • 服装细节保留:可精确模拟服装的纹理、图案和轮廓,在人物运动时保持真实感和稳定性。

  • 时空一致性建模:确保视频中各帧之间的连贯性,避免服装闪烁和抖动。

  • 多条件引导:基于文本、图像特征、服装标记和轮廓线标记等多种条件,生成更真实、更细致的试穿效果。

MagicTryOn应用场景.webp

MagicTryOn应用场景

  • 在线购物:用户可在线试穿不同服装。

  • 时尚设计:设计师能快速预览服装效果。

  • 虚拟试衣间:为实体店提供虚拟试衣服务。

  • 广告与营销:品牌可制作个性化试穿广告。

  • 游戏与娱乐:在游戏中实时试穿虚拟服装。

项目链接

项目官网:https://vivocameraresearch.github.io/magictryon/ 

GitHub 仓库:https://github.com/vivoCameraResearch/Magic-TryOn/ 

arXiv 技术论文:https://arxiv.org/pdf/2505.21325

收藏
最新工具
潮际好麦
潮际好麦

一个专为电商营销领域打造的AI商拍工具,提供模特生成、平铺 / ...

LetMeEnglish
LetMeEnglish

专注于帮助用户提升英文水平,LetMeEnglish提供免费的英...

DrawCut
DrawCut

一款免费的可以创建任意形状裁剪区域图像的在线工具,适用于自由形状...

CodeBox
CodeBox

一款智能浏览助手插件,支持Chrome、Edge、360、Fir...

DreamFace
DreamFace

一款能将照片转化为视频的AI视频生成工具,还能做出会说话的头像和...

Planner 5D
Planner 5D

一款好用的AI辅助家居设计工具。它能在10分钟内帮你画出平面图,...

Komiko
Komiko

一个辅助漫画创作、网络条漫、视觉故事、动画等视觉内容的AI绘图及...

PhotoGrid
PhotoGrid

一款免费的在线拼图制作器与照片编辑器,支持裁剪、调整参数、添加贴...

IC Light AI
IC Light AI

一款通过文本提示或参考背景图像控制图像灯光的AI工具,支持左侧光...

Slides.bot
Slides.bot

一款利用AI技术自动生成幻灯片的工具,可以将文本转化为幻灯片,适...