MagicTryOn:浙江大学和vivo推出的开源视频虚拟试穿项目

MagicTryOn是什么?

MagicTryOn 是浙江大学和 vivo 合作推出的开源视频虚拟试穿项目。它用视频扩散 Transformer 的 DiT 架构,让服装试穿看起来更真实、更稳当。这个项目靠全自注意力机制,保证视频各帧连贯,不会像老方法那样出现闪烁、抖动。它的主要功能有:精准保留服装细节,通过多条件引导生成更真实的试穿效果,还用掩码感知损失提升生成质量。在多个数据集上,MagicTryOn 表现很好,视觉质量和泛化能力都很强。

MagicTryOn:浙江大学和vivo推出的开源视频虚拟试穿项目.webp

MagicTryOn技术原理

  • 扩散 Transformer(DiT)架构:该架构模块化设计允许更灵活地注入条件信息,多级服装特征能有效整合到去噪过程中。其内置的全自注意力机制可联合建模视频的时空一致性,捕捉帧内局部细节和帧间动态变化。

  • 粗到细的服装保持策略:粗策略是在嵌入阶段,将服装标记注入输入标记序列,扩展旋转位置编码的网格大小,让服装标记和输入标记共享一致的位置编码;细策略是在去噪阶段,引入语义引导交叉注意力和特征引导交叉注意力模块,提供细粒度的服装细节引导。

  • 掩码感知损失(Mask-Aware Loss):基于此损失,模型能更专注于服装区域的生成,提高服装区域的细节保真度和整体合成结果的真实感。

MagicTryOn技术原理.webp

MagicTryOn主要功能

  • 服装细节保留:可精确模拟服装的纹理、图案和轮廓,在人物运动时保持真实感和稳定性。

  • 时空一致性建模:确保视频中各帧之间的连贯性,避免服装闪烁和抖动。

  • 多条件引导:基于文本、图像特征、服装标记和轮廓线标记等多种条件,生成更真实、更细致的试穿效果。

MagicTryOn应用场景.webp

MagicTryOn应用场景

  • 在线购物:用户可在线试穿不同服装。

  • 时尚设计:设计师能快速预览服装效果。

  • 虚拟试衣间:为实体店提供虚拟试衣服务。

  • 广告与营销:品牌可制作个性化试穿广告。

  • 游戏与娱乐:在游戏中实时试穿虚拟服装。

项目链接

项目官网:https://vivocameraresearch.github.io/magictryon/ 

GitHub 仓库:https://github.com/vivoCameraResearch/Magic-TryOn/ 

arXiv 技术论文:https://arxiv.org/pdf/2505.21325

收藏
最新工具
xAIcreator
xAIcreator

一款帮助管理社交媒体内容的工具,主要用来优化推特账号的运营。主要...

WearView
WearView

一个具有虚拟模特的专业时尚摄影AI平台,它不用实地拍摄、不用工作...

Linerider
Linerider

一款经典的物理模拟小游戏,游戏玩法很简单,也很有趣:玩家用鼠标画...

Tic Tac Toe
Tic Tac Toe

也叫井字棋,非常经典的两人对弈游戏,玩法是在3×3方格上,两名玩...

Transor AI
Transor AI

专业AI翻译工具,可以即时翻译网页、文档、图片与视频,提供免费的...

Slither.IO
Slither.IO

一款热门多人在线贪吃蛇游戏。玩家操控小蛇,吃地图上的小点来变长变...

Chessigma
Chessigma

一个免费的国际象棋分析工具,能分析你在 Chess、Liches...

Chronas
Chronas

一个将历史与地理结合的互动平台。你可以通过该Chronas查看不...

Hordes.io
Hordes.io

一款基于浏览器免费的多人在线战略游戏,属于 .io 类型,玩法类...

MineFun.io
MineFun.io

一款在线方块风格游戏,有跑酷模式,玩家能跳跃、躲障碍,挑战多种地...