CADCrafter:单张图片到参数化CAD模型生成框架

CADCrafter是什么?

CADCrafter 是一种由魔芯科技、新加坡南洋理工大学等机构研究人员提出的图像到参数化 CAD 模型生成框架。它能够直接从单张图片生成高质量、可编辑的 CAD 模型,这些模型可以通过 CAD 编译器编译为可用于生产的 3D 文件,解决了从图像到可编辑CAD模型的转换问题。

CADCrafter核心特点

  • 基于几何特征的生成:CADCrafter 使用几何编码器来准确捕捉图像中的几何特征,例如深度和法线图。这些特征不仅增强了模型的几何表示能力,还使得模型能够更好地从合成数据泛化到真实世界图像。

  • 直接偏好优化(DPO):由于将 CAD 参数序列编译为显式 CAD 模型是非可微分过程,CADCrafter 通过 DPO 方法利用 CAD 编译器的反馈来优化模型,确保生成的 CAD 指令具有更高的可编译性和几何精度。

  • 多视图到单视图的知识蒸馏:CADCrafter 通过将多视图几何编码器的知识蒸馏到单视图编码器中,提高了单视图输入的准确性和鲁棒性。

  • 数据集贡献:研究团队还收集了一个名为 RealCAD 的真实世界数据集,包含多视图图像和对应的 CAD 指令序列,用于验证模型的性能。

CADCrafter研究方法

CADCrafter只要通过下面几个步骤来实现从图像到CAD模型的转换:

  • CAD命令序列编码:将CAD命令序列编码为离散和连续的参数序列,并通过嵌入空间进行处理。

  • 几何条件编码器:提取输入图像的深度和法线图,利用这些几何特征来增强模型对几何结构的理解,并减少合成数据和真实图像之间的域差距。

  • 去噪CAD潜在向量:使用基于扩散模型的架构来去噪潜在CAD代码,该架构通过迭代学习恢复原始潜在向量。

  • 多视图到单视图的知识蒸馏:通过将多视图几何编码器的知识蒸馏到单视图几何编码器中,提高单视图输入的准确性和鲁棒性。

  • 直接偏好优化(DPO):通过CAD编译器的反馈来优化模型,确保生成的CAD指令具有更高的可编译性和几何精度。

CADCrafter:单张图片到参数化CAD模型生成框架.webp

实验

  • 数据集:使用DeepCAD数据集进行训练,并收集了一个名为RealCAD的真实世界数据集进行测试。

  • 评估指标:采用命令准确性(Acccmd)、参数准确性(Accpara)、中位数Chamfer距离(Med CD)和无效率(IR)来评估模型性能。

  • 结果:

  • 在DeepCAD数据集上,CADCrafter在多视图和单视图任务中均表现出色,显著降低了无效率。

  • 在RealCAD数据集上,尽管模型仅在合成数据上进行训练,但其在真实世界数据上的泛化能力表现良好,保持了高准确性和低无效率。

  • 与现有的图像到3D模型生成方法(如One-2-3-45、Wonder3D和TripoSR)相比,CADCrafter在几何精度上表现更好。

CADCrafter应用场景

  • 工业设计:快速生成可编辑的 CAD 模型,加速原型设计和零件重建。

  • 日常物体建模:通过拍摄日常生活中的物体,直接生成其设计制造时可用的工程文件。

CADCrafter论文:https://arxiv.org/pdf/2504.04753

收藏
最新工具
SoundWise AI
SoundWise AI

一个完全免费的AI音视频转录工具,能在浏览器里直接把音频和视频转...

Armor Games
Armor Games

全球知名免费在线游戏平台与独立游戏发行商​,ArmorGames...

Social Auto Upload
Social Auto Upload

社交媒体视频一键多平台发布工具​,一站式解决抖音、小红书、视频号...

在线DOS游戏
在线DOS游戏

一个能在浏览器直接玩DOS游戏的在线模拟器,适合怀旧玩家和游戏开...

HDLOGO
HDLOGO

HDLOGO 是一个专门整理矢量标志和图标的网站,提供各类品牌和...

Funes.world
Funes.world

一个在线博物馆项目,通过众包方式把世界各地的建筑做成3D模型,F...

PrettyScale
PrettyScale

一个在线面部分析及颜值打分网站,用户通过上传照片或直接用摄像头参...

圆周旅迹
圆周旅迹

一款旅游出行AI智能规划APP,它可以直接从小红书这些平台导入别...

Wonderplan AI
Wonderplan AI

一个免费的AI旅游规划工具,能根据你的喜好、需求生成专属行程,支...

智写流程
智写流程

一个能自动记录网页操作并生成操作指南的工具。它能捕捉鼠标点击、键...