Ai应用
Ai资讯
AI生图
AI生视频
FastbuildAI

首页 > Ai资讯 > Ai产品

SceneSplat：斯坦福大学和谷歌联合开发的开源3D场景理解工具

SceneSplat于2025-09-11发布在Ai产品

SceneSplat 是斯坦福大学和谷歌联合开发的开源 3D 场景理解工具，主要让 3D 高斯模型听懂人类语言指令，实现从文字到 3D 场景的转换。

SceneSplat：斯坦福大学和谷歌联合开发的开源3D场景理解工具

SceneSplat技术原理

端到端视觉语言预训练架构：通过同时学习语言描述和对应的 3D 场景，让模型听懂自然语言指令并转化成 3D 场景。比如输入“把书架放在靠窗的墙边”，模型能自动识别关键信息并准确放到三维空间里。
跨模态特征对齐：把 3D 高斯表示和视觉语言模型结合，通过多尺度特征提取和跨模态注意力机制，提升对复杂语言指令的理解能力。
自监督学习方案：能从未标记的场景里学到更多 3D 特征。

SceneSplat数据集

SceneSplat - 7K：首个室内场景大规模 3DGS 数据集，有 7916 个场景，来自 ScanNet 和 Matterport3D 等七个现有数据集。生成这个数据集大约需要在 L4 GPU 上运行 150 天。
SceneSplat - 49K：包含多种来源的室内外场景，是目前最全的开源数据集，有复杂且高质量的完整场景级别 3DGS 重建内容，能推动可泛化 3DGS 场景理解发展。

SceneSplat优势与特点

集成语义理解：首次在 3D 高斯模型里实现语义理解应用，突破了传统 3D 图形系统处理语义的局限。
原生运行在 3DGS 上：是首个能在 3DGS 上直接运行的大规模 3D 室内场景理解方法，避免了传统方法数据转换时的信息损失和计算延迟。
高效泛化能力：在开放词汇和语义分割测试中达到了当前最优效果。

SceneSplat应用场景

AR/VR：能实时处理 3D 点云，用自然语言回答问题并精准定位，让 AR/VR 交互更自然。
自动驾驶：帮自动驾驶系统更好理解复杂 3D 环境，提高决策准确性和安全性。
智能机器人：让机器人听懂人类指令，更精准完成任务。
3D 游戏开发：通过自然语言指令快速生成复杂 3D 环境，提升开发效率和游戏世界的动态生成能力。

相关资源

论文链接：https://arxiv.org/abs/2503.18052
项目主页：https://unique1i.github.io/SceneSplat_webpage/
数据集：https://huggingface.co/datasets/GaussianWorld/scene_splat_7k

收藏

Pick Anime Cool

上一篇

Pick Anime Cool

DeepSeek V3.1上线，更新了哪些功能？

下一篇

DeepSeek V3.1上线，更新了哪些功能？

相关文章

ImmerseGen：字节跳动和浙江大学联合开发的3

ImmerseGen：字节跳动和浙江大学联合开发的3

2025-06-21

Mnn3dAvatar：阿里开源的3D数字人框架，直

Mnn3dAvatar：阿里开源的3D数字人框架，直

2025-06-12

PartCrafter：单张图像生成多个部件和对象的

PartCrafter：单张图像生成多个部件和对象的

2025-06-12

HRAvatar：单目生成高质量3D头像方法

HRAvatar：单目生成高质量3D头像方法

2025-05-23

PrimitiveAnything：腾讯AIPD和清

PrimitiveAnything：腾讯AIPD和清

2025-05-14

Meta推出新一代3D基础模型：AssetGen 2

Meta推出新一代3D基础模型：AssetGen 2

2025-05-12

最新文章

最新工具

AI快研侠

一个专注用AI帮用户高效完成研究工作的产品，AI快研侠围绕“研究...

GameCreator

Catsoft Studios开发的游戏引擎，兼顾专业和爱好者需...

GirlsGoGames

简称GGG，是一个特别受女孩欢迎的在线免费游戏平台。它提供各种有...

SweetyGame

一个专门做给女孩子玩的小游戏网站，主要以可爱、时尚、名人元素为...

eSearch

一款开源跨平台工具，能截屏、OCR 识别、搜索、翻译、贴图、以图...

打字侠

一个在线中文打字练习平台，主要帮用户提升打字速度和准确度，覆盖从...

Fable Prism

Fable Prism 是在线动效设计平台 Fable 推出的A...

BongoCat

一款轻量级、开源且跨平台的桌面猫咪宠物应用，由开发者ayoung...

ValueCell AI

全球首个开源金融智能体平台，采用社区驱动和多智能体模式，Valu...

StudyFetch

受 CollegeBoard 支持的学习平台，支持把 PDF、D...

人生若只如初见

用户登录