MagicTryOn:浙江大学和vivo推出的开源视频虚拟试穿项目

MagicTryOn是什么?

MagicTryOn 是浙江大学和 vivo 合作推出的开源视频虚拟试穿项目。它用视频扩散 Transformer 的 DiT 架构,让服装试穿看起来更真实、更稳当。这个项目靠全自注意力机制,保证视频各帧连贯,不会像老方法那样出现闪烁、抖动。它的主要功能有:精准保留服装细节,通过多条件引导生成更真实的试穿效果,还用掩码感知损失提升生成质量。在多个数据集上,MagicTryOn 表现很好,视觉质量和泛化能力都很强。

MagicTryOn:浙江大学和vivo推出的开源视频虚拟试穿项目.webp

MagicTryOn技术原理

  • 扩散 Transformer(DiT)架构:该架构模块化设计允许更灵活地注入条件信息,多级服装特征能有效整合到去噪过程中。其内置的全自注意力机制可联合建模视频的时空一致性,捕捉帧内局部细节和帧间动态变化。

  • 粗到细的服装保持策略:粗策略是在嵌入阶段,将服装标记注入输入标记序列,扩展旋转位置编码的网格大小,让服装标记和输入标记共享一致的位置编码;细策略是在去噪阶段,引入语义引导交叉注意力和特征引导交叉注意力模块,提供细粒度的服装细节引导。

  • 掩码感知损失(Mask-Aware Loss):基于此损失,模型能更专注于服装区域的生成,提高服装区域的细节保真度和整体合成结果的真实感。

MagicTryOn技术原理.webp

MagicTryOn主要功能

  • 服装细节保留:可精确模拟服装的纹理、图案和轮廓,在人物运动时保持真实感和稳定性。

  • 时空一致性建模:确保视频中各帧之间的连贯性,避免服装闪烁和抖动。

  • 多条件引导:基于文本、图像特征、服装标记和轮廓线标记等多种条件,生成更真实、更细致的试穿效果。

MagicTryOn应用场景.webp

MagicTryOn应用场景

  • 在线购物:用户可在线试穿不同服装。

  • 时尚设计:设计师能快速预览服装效果。

  • 虚拟试衣间:为实体店提供虚拟试衣服务。

  • 广告与营销:品牌可制作个性化试穿广告。

  • 游戏与娱乐:在游戏中实时试穿虚拟服装。

项目链接

项目官网:https://vivocameraresearch.github.io/magictryon/ 

GitHub 仓库:https://github.com/vivoCameraResearch/Magic-TryOn/ 

arXiv 技术论文:https://arxiv.org/pdf/2505.21325

收藏
最新工具
ShutUpAndTakeMyMoney
ShutUpAndTakeMyMoney

一个专注于展示新奇、有趣和极客风格产品的网站,汇聚了各种流行文化...

Wappalyzer
Wappalyzer

一个强大的网站技术分析工具,可以识别网站所使用的技术栈,快速找出...

Kickstarter
Kickstarter

全球知名的创意众筹平台,它通过公众小额筹资,帮创作者和创业者把创...

Erlin AI
Erlin AI

是面向电商品牌的 AI可见性工具,帮助 DTC 品牌在 Chat...

BuildPaste
BuildPaste

一个为《我的世界》玩家提供即时建筑结构的平台,玩家可以通过下载其...

Receiptor AI
Receiptor AI

一款AI自动化财务管理工具,它能从邮件、WhatsApp 这些地...

CatDoes
CatDoes

一个不用写代码就能做应用的工具。它能帮你快速做出能直接用的手机应...

Bhava
Bhava

一款可以快速生成和编辑图表的工具,它能照你写的文字需求画出图表草...

OpenRouter AI
OpenRouter AI

一个整合多个AI模型的平台,提供统一的API接口,方便开发者调用...

PoseGeni
PoseGeni

专业 AI 姿势生成平台,主要服务摄影师、美甲师、3D 建模师、...