TRELLIS 3D

TRELLIS 3D

微软亚洲研究院联合清华、中科大搞出来的开源 3D 生成模型,通过 SLAT技术,能从一张2D 图片或者文字描述直接生成高质量的3D模型。

#行业圈子 #3D&游戏
收藏

TRELLIS 3D简介

TRELLIS 3D是什么

TRELLIS 3D是微软亚洲研究院联合清华、中科大搞出来的开源3D生成模型,通过 SLAT技术,能从一张2D 图片或者文字描述直接生成高质量的3D模型。

TRELLIS 3D这个模型有 40 亿参数,基于全新的 O-Voxel 表示法,能把空间压缩 16 倍,3 秒就能跑出 512³ 分辨率的带纹理模型。

TRELLIS 3D

TRELLIS 3D主要特点

  • 生成飞快:在 H100 上跑 512³ 只要 3 秒,1024³ 约 17 秒,1536³ 也就 1 分钟左右

  • 分辨率够高:512³ 到 1536³ 都能选,压缩比很夸张

  • 啥形状都能处理:不像传统方法只能做封闭模型,衣服、树叶这种开放表面,甚至内部有结构的物体都能搞

  • 材质系统完整:支持 PBR 全流程,基础色、粗糙度、金属度、透明度都有

  • 格式支持全:GLB、OBJ、STL、GLTF、USDZ、PLY、3D Gaussian 这些常用格式都能导出

  • 两种输入方式:既能图生 3D,也能文生 3D

  • 可以局部编辑:生成后还能对特定区域做增删改

  • 处理流程简单:纹理网格转 O-Voxel CPU 上不到 10 秒,反向转换 CUDA 100 毫秒搞定

TRELLIS 3D应用场景

  • 游戏开发:快速出场景道具、角色,美术不用从头建模

  • 影视动画:做特效资产、预览模型都很方便

  • VR/AR:生成逼真的虚拟物件,提升沉浸感

  • 工业设计:快速出产品原型验证设计

  • 电商:做可交互的 3D 商品展示

  • 3D 打印:直接生成可打印的模型文件

  • 教育科研:当 3D 数据生成工具

TRELLIS 3D优缺点分析

做得好的地方

  • 质量确实高:40 亿参数加上稀疏 3D VAE,细节和保真度都很能打

  • 速度没对手:3 秒出模型,比传统建模快太多了

  • 拓扑限制少:复杂几何结构也能处理,包括开放表面和内部结构

  • 材质很完善:PBR 工作流完整,透明效果也支持

  • 完全开源:MIT 协议,商用也没问题

  • 硬件门槛不算高:16GB 显存就能跑,RTX 3090/4090 都支持

不足之处

  • 吃硬件:想要极速生成还得是 H100 这种顶级卡,普通显卡会慢不少

  • 复杂细节有限制:人脸特征、细小纹理(比如绳子)这些地方生成效果还不够完美

  • 训练成本高:大规模预训练需要海量 3D 数据,自己从头训很烧钱

  • 放大看还是低模:边缘细节放大后略显粗糙,本质上还是低多边形模型

TRELLIS 3D使用教程

  1. 直接去TRELLIS 3D官网

  2. 传张 JPG/PNG 图片(建议 1920×1080 以上)

  3. 点生成,等几秒就能看到 3D 模型

  4. 预览满意后直接下载 GLB 或其他格式

TRELLIS 3D使用教程

常见问题

  • TRELLIS 3D生成太慢?

    确认 CUDA 加速已开启,推荐 RTX 4090 或更高;降低分辨率能提速。

  • 显存爆了?

    设环境变量 PYTORCH_CUDA_ALLOC_CONF=expandable_segments:True 能省显存。

  • 透明效果没出来?

    GLB 默认不透明,需要在 3D 软件里手动把纹理 Alpha 连到透明度。

  • 细节不够锐?

    试试 1024³ 或 1536³ 分辨率;特别复杂的结构目前技术还有天花板。

  • 支持什么图片格式?

    JPG、PNG、WEBP 都行,带透明通道的会当遮罩用。

  • 能商用吗?

    可以,MIT 协议开源,但注意依赖项(如 nvdiffrast)可能有自己独立的许可证。

  • 想自己微调?

    TRELLIS.2 提供了完整训练代码,用 train.py 就能微调或从头训。

相关资讯:

AI生成3D模型

与TRELLIS 3D相关工具