CADCrafter:单张图片到参数化CAD模型生成框架

CADCrafter是什么?

CADCrafter 是一种由魔芯科技、新加坡南洋理工大学等机构研究人员提出的图像到参数化 CAD 模型生成框架。它能够直接从单张图片生成高质量、可编辑的 CAD 模型,这些模型可以通过 CAD 编译器编译为可用于生产的 3D 文件,解决了从图像到可编辑CAD模型的转换问题。

CADCrafter核心特点

  • 基于几何特征的生成:CADCrafter 使用几何编码器来准确捕捉图像中的几何特征,例如深度和法线图。这些特征不仅增强了模型的几何表示能力,还使得模型能够更好地从合成数据泛化到真实世界图像。

  • 直接偏好优化(DPO):由于将 CAD 参数序列编译为显式 CAD 模型是非可微分过程,CADCrafter 通过 DPO 方法利用 CAD 编译器的反馈来优化模型,确保生成的 CAD 指令具有更高的可编译性和几何精度。

  • 多视图到单视图的知识蒸馏:CADCrafter 通过将多视图几何编码器的知识蒸馏到单视图编码器中,提高了单视图输入的准确性和鲁棒性。

  • 数据集贡献:研究团队还收集了一个名为 RealCAD 的真实世界数据集,包含多视图图像和对应的 CAD 指令序列,用于验证模型的性能。

CADCrafter研究方法

CADCrafter只要通过下面几个步骤来实现从图像到CAD模型的转换:

  • CAD命令序列编码:将CAD命令序列编码为离散和连续的参数序列,并通过嵌入空间进行处理。

  • 几何条件编码器:提取输入图像的深度和法线图,利用这些几何特征来增强模型对几何结构的理解,并减少合成数据和真实图像之间的域差距。

  • 去噪CAD潜在向量:使用基于扩散模型的架构来去噪潜在CAD代码,该架构通过迭代学习恢复原始潜在向量。

  • 多视图到单视图的知识蒸馏:通过将多视图几何编码器的知识蒸馏到单视图几何编码器中,提高单视图输入的准确性和鲁棒性。

  • 直接偏好优化(DPO):通过CAD编译器的反馈来优化模型,确保生成的CAD指令具有更高的可编译性和几何精度。

CADCrafter:单张图片到参数化CAD模型生成框架.webp

实验

  • 数据集:使用DeepCAD数据集进行训练,并收集了一个名为RealCAD的真实世界数据集进行测试。

  • 评估指标:采用命令准确性(Acccmd)、参数准确性(Accpara)、中位数Chamfer距离(Med CD)和无效率(IR)来评估模型性能。

  • 结果:

  • 在DeepCAD数据集上,CADCrafter在多视图和单视图任务中均表现出色,显著降低了无效率。

  • 在RealCAD数据集上,尽管模型仅在合成数据上进行训练,但其在真实世界数据上的泛化能力表现良好,保持了高准确性和低无效率。

  • 与现有的图像到3D模型生成方法(如One-2-3-45、Wonder3D和TripoSR)相比,CADCrafter在几何精度上表现更好。

CADCrafter应用场景

  • 工业设计:快速生成可编辑的 CAD 模型,加速原型设计和零件重建。

  • 日常物体建模:通过拍摄日常生活中的物体,直接生成其设计制造时可用的工程文件。

CADCrafter论文:https://arxiv.org/pdf/2504.04753

收藏
最新工具
Gempix2 AI
Gempix2 AI

一款集生成和编辑图像于一体的的AI图像生成工具,提供包括文本转图...

极像素
极像素

一个展示和探索超高像素全景图像的在线平台,能提供全球各地超高分辨...

Krunker.io
Krunker.io

一款免费的在线多人第一人称射击游戏,直接在网页就能玩。游戏玩法多...

转换云
转换云

一个在线音乐格式转换网站,包括.ncm、.mgg、.mflac、...

萝卜工坊
萝卜工坊

一个能把电子文本变成逼真手写风格的在线工具。它有AI专属字体制作...

LyricsPoster
LyricsPoster

一个帮你把喜欢的歌手图片和歌词做成海报的在线工具。你可以在简单的...

蓝豆打字
蓝豆打字

一个在线打字练习平台,提供键盘指法、拼音、双拼、五笔、源代码、英...

一页纸EasyPaper
一页纸EasyPaper

一个能生成自定义纸张的免费在线工具。通过网页界面,用户可自行设置...

88查
88查

阿里旗下1688推出的企业信息查询和商业情报工具。它利用大模型实...

Sleep Calculator
Sleep Calculator

一种利用睡眠周期设计的工具。输入期望起床时间,它能自动算出多个适...