MultiGO:实现了从单张图像生成高保真3D人体模型的突破

MultiGO是什么?

港科广团队的MultiGO方案用分层建模的方式,从单张图片生成高保真3D人体模型,把人体从基础体型到细节纹理分层细化,解决了传统三维重建细节不足的问题。这个成果入选了CVPR 2025,还能用在虚拟试衣、游戏角色生成和影视特效等领域。它通过三级几何学习增强了对深度误差的抗性,能把表面细节还原到亚毫米级别,很有实用价值。

MultiGO:实现了从单张图像生成高保真3D人体模型的突破.webp

MultiGO技术

三级几何学习框架

  • 骨架增强模块:通过将3D傅里叶特征投影到2D空间,结合SMPL-X人体网格作为几何先验,增强人体骨架的建模。傅里叶空间位置编码提升了3D模型与2D图像的语义对齐能力,使得模型能够更精准地捕捉到人体姿态特征。

  • 关节增强策略:在训练过程中对关节点位置施加扰动,提升模型对深度估计误差的鲁棒性。这一策略通过重点调整影响深度感知的参数,避免因深度歧义导致的肢体位置重建不准确。

  • 皱纹优化模块:采用类似扩散模型去噪的方法,将表面皱纹视为可优化的噪声模式,逐步恢复出更精细化的高频细节。这一创新方法使得MultiGO能够生成亚毫米级的表面细节,有效弥补了传统方法在衣物褶皱等高频细节上的不足。

高精度细节还原

  • MultiGO通过三级分层建模策略,实现了从宏观姿态到微观细节的多尺度精细化重建。实验结果显示,MultiGO在CustomHuman和THuman3.0两个测试集上均取得了行业领先的性能指标。

工作原理

SLE 模块将 3D 傅里叶特征投影到输入图像 2D 空间,让高斯重建模型利用人体形状先验知识,准确捕捉人体姿势;JLA 策略在训练时施加受控扰动,提高模型在推理时对深度误差的鲁棒性,改善人体关节深度估计;WLR 模块把粗糙网格视为高斯噪声,以重建高斯的高质量纹理为条件细化褶皱,优化几何细节。

MultiGO优势

  • 高保真3D人体重建:能够从单目图像中生成高保真的3D人体模型,支持衣物褶皱、皮肤纹理等细节的精细重建。

  • 快速生成与调整:支持快速生成个性化3D虚拟形象,并允许灵活调整细节,显著降低美术资源生产成本。

  • 多场景适配:适用于需要快速生成且对真实感和多尺度细节还原要求高的应用场景。

MultiGO的应用场景

  • 虚拟试衣与时尚电商:消费者只需上传一张全身照片,即可生成高保真的3D人体模型,系统能够自动模拟不同服装的穿着效果。

  • 游戏与元宇宙:通过单张照片快速创建个性化的3D虚拟形象,分层结构支持灵活调整。

  • 影视特效与虚拟制作:在特效制作中,演员的单视角照片即可重建高精度3D模型,用于动作捕捉或替身合成,分层设计允许后期单独编辑特定层级。

项目链接

https://multigohuman.github.io/

收藏
最新工具
OiiOii ai
OiiOii ai

全球首个专业动画创作平台,通过多个智能模块协同工作,实现从创意到...

扣子空间PPT
扣子空间PPT

扣子空间的这个PPT功能可以一句话生成完整ppt,从大纲、设计到...

Viw AI
Viw AI

一个能直接生成图片和视频的工具平台,把Sora、Veo、Seed...

数学乐
数学乐

Math is Fun 的中文版本,它致力于用简单有趣的方式教大...

PimEyes
PimEyes

一个反向图像搜索和面部识别的搜索引擎。你在它上面上传一张清楚的人...

Uiverse
Uiverse

一个开源免费的UI元素库,里面有3500多个现成组件,都是用纯C...

WindowSwap
WindowSwap

一个让用户可以上传和观看来自世界各地的窗外10分钟高清视频的在线...

Ventusky
Ventusky

一个全球天气信息网站,提供天气预报、天气地图和雷达服务。 它可以...

FreeSewing
FreeSewing

一个利用用户的身体测量数据生成完全量身定制的缝纫纸样的开源平台,...

Social Catfish
Social Catfish

一个专注于帮助用户识别和防范网络诈骗的网站,能帮用户防诈骗、核实...