LHM:阿里推出的单张图像重建出可动画化的3D人体模型

LHM是什么?

LHM是由阿里巴巴通义实验室提出的用于从单张图像重建可动画化3D人体模型的技术。解决从单张图像重建3D人体时的几何、外观和变形解耦问题,通俗地讲,也就是只需提供一张照片,几秒钟就可创建出一个3D人体模型,这个人体模型可以做各种动作,衣服、头发、面部等细节保持的很好,效果看起来非常逼真。

LHM:阿里推出的单张图像重建出可动画化的3D数字人模型.webp

LHM技术亮点

多模态Transformer架构:

  • 利用多模态Transformer架构,有效编码人体位置特征和图像特征。

  • 通过注意力机制保留细节,尤其是衣物的几何形状和纹理。

头部特征金字塔编码方案:

  • 提出头部特征金字塔编码方案,聚合头部区域的多尺度特征。

  • 提升面部身份的保留和细节恢复能力。

3D高斯绘制(Gaussian Splatting):

  • 将3D人体表示为高斯绘制,支持实时、逼真的渲染和姿态控制的动画。

LHM方法流程

  • 输入图像:从输入图像中提取身体和头部的图像标记(tokens)。

  • 多模态Transformer融合:利用提出的 Multimodal Body-Head Transformer (MBHT) 将3D几何身体标记与图像标记融合。

  • 解码为高斯参数:经过基于注意力的融合过程后,几何身体标记被解码为高斯参数。

LHM实验结果

  • 快速重建:LHM 能够在数秒内从单张图像中重建出可动画化的3D人体模型,无需后处理。

  • 高精度与泛化能力:在合成数据集和真实场景数据集上的实验表明,LHM 在重建精度、泛化能力和动画一致性方面达到了行业领先水平。

  • 面部和手部细节:LHM 能够生成逼真的面部和手部细节,优于现有方法。

LHM:阿里推出的单张图像重建出可动画化的3D数字人模型.jpg

LHM特点

  • 快速重建:LHM能够在数秒内从单张图像中重建出可动画化的3D人体模型,无需后处理。

  • 高精度与泛化能力:在合成数据集和真实场景数据集上的实验表明,LHM在重建精度、泛化能力和动画一致性方面达到了行业领先水平。

  • 实时渲染与动画控制:重建的模型支持实时渲染和姿态控制的动画,适用于沉浸式AR/VR等应用场景。

LHM应用场景

  • 元宇宙:为用户提供个性化的3D虚拟形象,增强虚拟世界的沉浸感。

  • 影视制作:快速生成高质量的3D角色模型,提高制作效率。

  • 游戏开发:创建逼真的3D游戏角色,提升游戏的视觉效果。

相关链接

GitHub 代码库:https://github.com/aigc3d/LHM

项目主页:https://lingtengqiu.github.io/LHM/

论文:https://arxiv.org/abs/2503.10625

收藏
最新工具
GradientHunt
GradientHunt

一个免费的色彩灵感平台,提供大量手工制作的时尚渐变色,目标是成为...

特工宇宙
特工宇宙

国内首个专注于Agent的科技媒体,由杭州电子科技大学00后毕业...

面灵AI
面灵AI

一款面试辅助工具,能实时分析面试问题并给出专业建议,支持多语言面...

Teleprompter Online
Teleprompter Online

一款免费的在线提词器网页应用,能在PC或Mac的现代网页浏览器上...

Gallerix
Gallerix

也叫“巨人网上博物馆”,是个专注艺术的互联网博物馆,Galler...

快手Kwali
快手Kwali

磁力引擎旗下磁力开创平台推出的AI视频I创作工具,输入自然语言指...

磁力开创
磁力开创

快手磁力引擎推出的一站式视频创意生产平台,结合智能化功能和简化流...

MindLuster
MindLuster

中东和北非地区最大的一个免费在线课程平台,和哈佛、斯坦福、麻省理...

ArticleRewriterTool
ArticleRewriterTool

一个免费的在线文章、句子及段落改写工具,用 AI 技术优化内容,...

RetroGames.onl
RetroGames.onl

一个能在线玩复古游戏的游戏平台,直接用浏览器就能免费玩经典游戏机...