MagicTryOn:浙江大学和vivo推出的开源视频虚拟试穿项目

MagicTryOn是什么?

MagicTryOn 是浙江大学和 vivo 合作推出的开源视频虚拟试穿项目。它用视频扩散 Transformer 的 DiT 架构,让服装试穿看起来更真实、更稳当。这个项目靠全自注意力机制,保证视频各帧连贯,不会像老方法那样出现闪烁、抖动。它的主要功能有:精准保留服装细节,通过多条件引导生成更真实的试穿效果,还用掩码感知损失提升生成质量。在多个数据集上,MagicTryOn 表现很好,视觉质量和泛化能力都很强。

MagicTryOn:浙江大学和vivo推出的开源视频虚拟试穿项目.webp

MagicTryOn技术原理

  • 扩散 Transformer(DiT)架构:该架构模块化设计允许更灵活地注入条件信息,多级服装特征能有效整合到去噪过程中。其内置的全自注意力机制可联合建模视频的时空一致性,捕捉帧内局部细节和帧间动态变化。

  • 粗到细的服装保持策略:粗策略是在嵌入阶段,将服装标记注入输入标记序列,扩展旋转位置编码的网格大小,让服装标记和输入标记共享一致的位置编码;细策略是在去噪阶段,引入语义引导交叉注意力和特征引导交叉注意力模块,提供细粒度的服装细节引导。

  • 掩码感知损失(Mask-Aware Loss):基于此损失,模型能更专注于服装区域的生成,提高服装区域的细节保真度和整体合成结果的真实感。

MagicTryOn技术原理.webp

MagicTryOn主要功能

  • 服装细节保留:可精确模拟服装的纹理、图案和轮廓,在人物运动时保持真实感和稳定性。

  • 时空一致性建模:确保视频中各帧之间的连贯性,避免服装闪烁和抖动。

  • 多条件引导:基于文本、图像特征、服装标记和轮廓线标记等多种条件,生成更真实、更细致的试穿效果。

MagicTryOn应用场景.webp

MagicTryOn应用场景

  • 在线购物:用户可在线试穿不同服装。

  • 时尚设计:设计师能快速预览服装效果。

  • 虚拟试衣间:为实体店提供虚拟试衣服务。

  • 广告与营销:品牌可制作个性化试穿广告。

  • 游戏与娱乐:在游戏中实时试穿虚拟服装。

项目链接

项目官网:https://vivocameraresearch.github.io/magictryon/ 

GitHub 仓库:https://github.com/vivoCameraResearch/Magic-TryOn/ 

arXiv 技术论文:https://arxiv.org/pdf/2505.21325

收藏
最新工具
软件自学网
软件自学网

一个教各类软件的在线学习网站,主要教CAD、UG、SolidWo...

AdpexAI
AdpexAI

一个一站式生成式在线AI工具平台,不用装软件,打开浏览器就能用。...

Fiddl.art
Fiddl.art

支持自定义模型、创作和赚钱的AI 艺术生成平台,想法就是把创作、...

Dr.Watermark
Dr.Watermark

一个AI在线去水印工具,能自己找到并去掉图片里的字、Logo、全...

CityWalks.live
CityWalks.live

一个能在线逛城市的直播平台,有阿姆斯特丹、纽约、东京这些国家和地...

Talkpal AI
Talkpal AI

是一个用“口语对话”来学语言的AI学习工具,主打与AI导师进行实...

NeoDomain
NeoDomain

智灵新境AI创意工坊,用AI帮你把想法快速变成视频、图片等创意作...

飞象老师
飞象老师

猿辅导旗下飞象星球推出国内首个教师专用AI工具“飞象老师”,该工...

花生AI
花生AI

B站面向视频创作者的AIGC一站式剪辑工具,主要给UP主、MCN...

Habitica
Habitica

一个免费的习惯养成和效率工具,能用手机或者网页来管习惯、每日目标...