MagicTryOn:浙江大学和vivo推出的开源视频虚拟试穿项目

MagicTryOn是什么?

MagicTryOn 是浙江大学和 vivo 合作推出的开源视频虚拟试穿项目。它用视频扩散 Transformer 的 DiT 架构,让服装试穿看起来更真实、更稳当。这个项目靠全自注意力机制,保证视频各帧连贯,不会像老方法那样出现闪烁、抖动。它的主要功能有:精准保留服装细节,通过多条件引导生成更真实的试穿效果,还用掩码感知损失提升生成质量。在多个数据集上,MagicTryOn 表现很好,视觉质量和泛化能力都很强。

MagicTryOn:浙江大学和vivo推出的开源视频虚拟试穿项目.webp

MagicTryOn技术原理

  • 扩散 Transformer(DiT)架构:该架构模块化设计允许更灵活地注入条件信息,多级服装特征能有效整合到去噪过程中。其内置的全自注意力机制可联合建模视频的时空一致性,捕捉帧内局部细节和帧间动态变化。

  • 粗到细的服装保持策略:粗策略是在嵌入阶段,将服装标记注入输入标记序列,扩展旋转位置编码的网格大小,让服装标记和输入标记共享一致的位置编码;细策略是在去噪阶段,引入语义引导交叉注意力和特征引导交叉注意力模块,提供细粒度的服装细节引导。

  • 掩码感知损失(Mask-Aware Loss):基于此损失,模型能更专注于服装区域的生成,提高服装区域的细节保真度和整体合成结果的真实感。

MagicTryOn技术原理.webp

MagicTryOn主要功能

  • 服装细节保留:可精确模拟服装的纹理、图案和轮廓,在人物运动时保持真实感和稳定性。

  • 时空一致性建模:确保视频中各帧之间的连贯性,避免服装闪烁和抖动。

  • 多条件引导:基于文本、图像特征、服装标记和轮廓线标记等多种条件,生成更真实、更细致的试穿效果。

MagicTryOn应用场景.webp

MagicTryOn应用场景

  • 在线购物:用户可在线试穿不同服装。

  • 时尚设计:设计师能快速预览服装效果。

  • 虚拟试衣间:为实体店提供虚拟试衣服务。

  • 广告与营销:品牌可制作个性化试穿广告。

  • 游戏与娱乐:在游戏中实时试穿虚拟服装。

项目链接

项目官网:https://vivocameraresearch.github.io/magictryon/ 

GitHub 仓库:https://github.com/vivoCameraResearch/Magic-TryOn/ 

arXiv 技术论文:https://arxiv.org/pdf/2505.21325

收藏
最新工具
Loot Drop
Loot Drop

创业墓地,失败创业项目复盘的免费知识平台,它收集、整理并分析了超...

超级小说家
超级小说家

一款面向小说创作全流程的AI工具,定位为"从灵感到成文...

PixPark AI
PixPark AI

一个免费的通用AI图像生成与编辑平台,覆盖从生成到编辑的完整流程...

魔因漫创
魔因漫创

AI 影视生产级工具,支持 Seedance2.0,剧本、角色、...

PopShort.AI
PopShort.AI

一个AI短剧创作平台。它有个核心想法,就是“一个人就能组成一支制...

Gaga AI
Gaga AI

Sand.ai团队开发的全球首个专注于“人物对话”场景的影视级A...

Story-Iter
Story-Iter

UCSC-VLAA提出的长故事可视化解决方案。可根据叙事文本生成...

猫影短剧Novelvids
猫影短剧Novelvids

GitHub 上由用户Anning01创建的novelvids项...

NarratoAI
NarratoAI

一款基于LLM的开源一站式AI影视解说与自动化剪辑工具,将&qu...

Laper AI
Laper AI

专为编剧打造的AI辅助创作平台,定位为"全球首个AI编...