CADCrafter:单张图片到参数化CAD模型生成框架

CADCrafter是什么?

CADCrafter 是一种由魔芯科技、新加坡南洋理工大学等机构研究人员提出的图像到参数化 CAD 模型生成框架。它能够直接从单张图片生成高质量、可编辑的 CAD 模型,这些模型可以通过 CAD 编译器编译为可用于生产的 3D 文件,解决了从图像到可编辑CAD模型的转换问题。

CADCrafter核心特点

  • 基于几何特征的生成:CADCrafter 使用几何编码器来准确捕捉图像中的几何特征,例如深度和法线图。这些特征不仅增强了模型的几何表示能力,还使得模型能够更好地从合成数据泛化到真实世界图像。

  • 直接偏好优化(DPO):由于将 CAD 参数序列编译为显式 CAD 模型是非可微分过程,CADCrafter 通过 DPO 方法利用 CAD 编译器的反馈来优化模型,确保生成的 CAD 指令具有更高的可编译性和几何精度。

  • 多视图到单视图的知识蒸馏:CADCrafter 通过将多视图几何编码器的知识蒸馏到单视图编码器中,提高了单视图输入的准确性和鲁棒性。

  • 数据集贡献:研究团队还收集了一个名为 RealCAD 的真实世界数据集,包含多视图图像和对应的 CAD 指令序列,用于验证模型的性能。

CADCrafter研究方法

CADCrafter只要通过下面几个步骤来实现从图像到CAD模型的转换:

  • CAD命令序列编码:将CAD命令序列编码为离散和连续的参数序列,并通过嵌入空间进行处理。

  • 几何条件编码器:提取输入图像的深度和法线图,利用这些几何特征来增强模型对几何结构的理解,并减少合成数据和真实图像之间的域差距。

  • 去噪CAD潜在向量:使用基于扩散模型的架构来去噪潜在CAD代码,该架构通过迭代学习恢复原始潜在向量。

  • 多视图到单视图的知识蒸馏:通过将多视图几何编码器的知识蒸馏到单视图几何编码器中,提高单视图输入的准确性和鲁棒性。

  • 直接偏好优化(DPO):通过CAD编译器的反馈来优化模型,确保生成的CAD指令具有更高的可编译性和几何精度。

CADCrafter:单张图片到参数化CAD模型生成框架.webp

实验

  • 数据集:使用DeepCAD数据集进行训练,并收集了一个名为RealCAD的真实世界数据集进行测试。

  • 评估指标:采用命令准确性(Acccmd)、参数准确性(Accpara)、中位数Chamfer距离(Med CD)和无效率(IR)来评估模型性能。

  • 结果:

  • 在DeepCAD数据集上,CADCrafter在多视图和单视图任务中均表现出色,显著降低了无效率。

  • 在RealCAD数据集上,尽管模型仅在合成数据上进行训练,但其在真实世界数据上的泛化能力表现良好,保持了高准确性和低无效率。

  • 与现有的图像到3D模型生成方法(如One-2-3-45、Wonder3D和TripoSR)相比,CADCrafter在几何精度上表现更好。

CADCrafter应用场景

  • 工业设计:快速生成可编辑的 CAD 模型,加速原型设计和零件重建。

  • 日常物体建模:通过拍摄日常生活中的物体,直接生成其设计制造时可用的工程文件。

CADCrafter论文:https://arxiv.org/pdf/2504.04753

收藏
最新工具
ChinaTextbook
ChinaTextbook

一个专门收集和分享中国大陆从小学到大学的教材资源的开源项目,特别...

暗壳AI
暗壳AI

家居AIGC营销与导购工具,它号称“一人即团队”,能够快速生成渲...

UntitledPen
UntitledPen

一个可以生成真实人声旁白的工具,也就是能够在一个平台上编写、编辑...

PageAI
PageAI

一款AI网站生成工具,就像一个小型创意工作室一样,能在短时间内根...

Seedance AI
Seedance AI

字节跳动推出的一款强大的视频生成工具,借助 Seedance 1...

ChatPs
ChatPs

ChatPs 是一款为 Photoshop 设计的插件,它背后是...

趣丸千音
趣丸千音

一个AI语音创作平台,专注提供一站式智能语音解决方案。集成文本转...

太极神器 TAICHI-flet
太极神器 TAICHI-flet

基于flet的一款多功能娱乐软件,实现了浏览图片、音乐、小说、各...

YIKM
YIKM

一个能在线玩小霸王、红白机、街机、FC 等经典游戏的地方,像《魂...

Bridgely
Bridgely

基于AI的实时通用翻译浏览器扩展,支持 60 多种语言,包括 W...