《A Survey on Deep Learning in 3D CAD Reconstruction论文精读》
目录
前言
《基于深度学习的 3D CAD 重建综述》
福州大学2025年发布在MDPI
三维CAD重建是工业制造、建筑、医学、影视、科研与教育等领域中一项长期且重要的任务。CAD模型的重建一直是机器学习领域中的一项持续挑战。关于深度学习在三维重建领域的研究已有诸多成果。近年来,随着CAD数据集的发布,利用深度学习进行三维CAD重建的研究日益增多。随着研究的不断深入,深度学习显著提升了CAD重建领域任务的性能。然而,由于数据稀缺与标注困难、模型复杂度高以及泛化性与适应性不足,该任务仍然具有挑战性。本文回顾了基于深度学习的3D CAD重建任务的经典及最新研究成果。据我们所知,这是首次针对深度学习领域中CAD重建任务的综述研究。由于与3D CAD重建相关的研究相对较少,我们也对2D CAD草图的重建与生成进行了调研。根据输入数据的不同,我们将所有研究分为以下几类:点云输入到3D CAD模型、草图输入到3D CAD模型、其他输入到3D CAD模型、2D草图的重建与生成、CAD数据的表征、CAD数据集以及相关评估指标。我们在分类体系中概述了常用的数据集。本文简要介绍了当前的研究背景、挑战以及最新成果,最后讨论了未来的研究方向。
1. 引言
CAD 3D 建模广泛应用于各行各业,对工作效率和设计精度产生了深远影响。三维 CAD 模型构成了现代设计与制造的核心,在产品设计、建筑规划和医疗设备定制中发挥着关键作用。因此,CAD 3D 重建任务在许多领域都至关重要[1,2]。它在制造业与工业设计、建筑、医学、影视、科研与教育等领域具有广阔的应用前景[3–6]。CAD 3D 重建指的是通过计算机处理给定的输入数据(如点云或草图)来生成 3D CAD 模型。在制造业中,CAD 3D 重建可以从草图中快速生成可制造的 3D 模型,缩短产品开发周期。在建筑领域,它可以帮助建筑师快速将设计意图转化为可视化的 3D 模型。在医疗和影视行业,它可分别用于定制化医疗设备和虚拟模型制作。在科研与教育领域,学生和研究人员可以生成可视化模型以提高教学与研究效率,如图 1 所示。成熟 CAD 重建技术的出现与应用,将提升各行业未来的效率与准确性,并促进行业的创新与进步。
传统的 CAD 3D 重建方法依赖于手动工具操作。尽管这些方法在简单场景下有效,但在面对复杂几何结构时表现出明显的局限性。手动工具操作通常需要经验丰富的专家进行调整和优化,自动化程度低,无法适应大规模工业应用的需求。
近年来,随着 CAD 表示形式的大规模数据集的出现,机器学习和深度学习领域的研究者开始研究 CAD 数据[7–10],如图 2 所示。先前的研究已将这些数据集用于许多研究应用,例如分割、分类和装配[11,12]。为了解决传统 CAD 3D 重建的问题,近年来深度学习被引入 CAD 3D 重建领域,极大地提高了重建的自动化程度和模型生成的质量。随着研究的深入,出现了一系列通过 2D 草图或 3D 模型生成结构化 CAD 数据的深度学习方法[13–15]。此外,还有关于 B-rep(边界表示)的研究,用于生成聚焦且无约束的 CAD 模型。B-rep 是 CAD 数据的一种形式[16,17]。关于 CAD 的表示形式,针对 CSG(构造实体几何)表示形式的 3D 学习研究逐渐增多[18–20],追求学习模型的通用性、简洁性和质量。至于边界表示,神经网络在 1990 年代就被应用于其分割任务[21–24],但由于缺乏数据集等因素,直到近年才取得显著进展[16,25]。最近的 CAD 生成模型也使用拉伸建模操作来避免直接生成 B-rep[26–28]。拉伸建模操作是一种常见的参数化建模方法,通过沿给定方向延伸二维截面来构建三维几何体。与传统的手动工具操作方法相比,这些研究的出现不仅降低了对 CAD 3D 重建专业知识的依赖,还将大大加快重建过程。
3D CAD 的重建一直是深度学习领域的一个挑战。在过去的二十年中,随着技术的不断发展,在该领域实现 3D CAD 重建已变得越来越可行[29]。研究界一直致力于从点云、草图和其他形式重建 3D CAD 模型,同时也有关于 2D CAD 草图生成的相关研究[30–32]。
近年来,CAD 3D 重建取得了显著进展,特别是随着深度学习的引入,带来了更智能、更自动化的重建过程。深度学习不仅克服了传统方法的局限性,还为未来的大规模工业应用提供了技术基础。本综述旨在全面总结深度学习在 3D CAD 重建领域的相关工作。本文的主要贡献总结如下:
- 我们简要回顾了基于深度学习的 3D CAD 重建的最新进展。此外,还给出了近年来的研究方法与研究趋势。
- 我们根据不同的输入模态(包括点云、草图和其他形式)总结了现有的重建方法。我们还总结了基于深度学习的 CAD 草图设计生成。
- 我们介绍了深度学习框架中常用的 CAD 数据表示格式,这有助于提高对模型结构和设计一致性的理解。
- 我们总结了常用的公共 CAD 数据集。
- 我们讨论了主要挑战、现有局限性以及未来的潜在研究方向。
本文的组织结构如下:在第 2 节中,我们介绍了基于深度学习的从点云数据重建 3D CAD 模型的方法。第 3 节介绍了从草图重建 3D CAD 模型的方法。第 4 节介绍了从其他形式重建 3D CAD 模型的方法。第 5 节讨论了用于 CAD 草图生成的深度学习方法,如图 3 所示。在第 6 节中,介绍并解释了 CAD 数据表示格式。第 7 节回顾了常用的 CAD 数据集。第 8 节介绍了一些评估指标。第 9 节对全文进行总结,并展望未来的研究方向。


2. 从点云到CAD模型的重建
将原始几何体逆向工程为CAD模型是一项基础任务[33]。从点云到CAD模型的重建就是该过程的一部分。CAD模型的形式包括一系列拉伸柱体、二维草图加上拉伸轴和范围,以及通过布尔运算对它们进行组合[30]。布尔运算是一种几何操作,用于通过并集、交集和差集等操作组合多个实体[34]。要通过点云逆向工程重建CAD模型,首先需要通过3D传感器获取点云,然后将其分解为基本图元或曲面,再使用一些现有的形状建模器进行进一步分析[35–37]。近年来,针对复杂场景中点云的处理和几何重建,研究出了多种分析与建模方法[38–41]。未来,这些方法可能为从点云到CAD模型的重建带来新思路。从CAD用户的角度来看,整个建模过程通常从草图开始。首先绘制一个二维草图,它是一个闭合曲线。然后将其拉伸为三维实体[10]。之后,这些三维形状可以通过并集、交集和差集等操作进行组合。
对于将点云逆向工程为CAD建模中可用的基本图元[42,43],传统方法是首先将点云转换为网格,然后通过一系列操作生成边界表示[44],再推断出输入内容可在CAD程序中生成边界表示[45]。
DeepCAD [10] 提出了一种基于Transformer的方法来生成完整的3D CAD模型,为后续与点云建模相关的应用提供了技术方向。Uy 等人 [30] 提出了一个监督学习框架 (point2cyl),可以将原始3D点云数据转换为一组带有拉伸参数的柱体,使得从点云重建CAD模型成为可能,并支持用户对重建结果进行编辑。该方法将拉伸柱体的建模视为一个参数化的几何单元,用于共同表达多个草图拉伸过程,并已在CAD建模和几何表示中展示了其适用性[46,47]。Cherenkova 等人 [48] 提出了 PVDeConv,这是一个神经模块,用于从密集体素或点云特征中重建结构化的CAD配置。Yang 等人 [49] 提出了 PS-CAD,通过自回归模型从点云数据重建CAD建模序列,并使用局部几何信息作为引导[50]。然而,该方法缺乏不同草图拉伸之间的设计规则约束。
Guo 等人 [13] 提出了 ComplexGen,用于从输入点云或隐式表示中重建高质量的B-rep CAD模型。
在最近的研究中,Liu 等人 [51] 提出了一种网络架构 (PC2WF),可以直接将3D点云映射为矢量线框,线框由3D关节点和连接它们的边组成,表示物体的结构轮廓[52]。重建的线框可以驱动并帮助创建3D CAD模型。线框节省存储空间,易于在CAD软件(如AutoCAD 2024或类似软件)中进行各种操作编辑,并可应用于零件设计与制造、CAD模型创建等许多领域[53,54]。对于特定应用中的CAD重建,例如管道系统和建筑设施,一些研究聚焦于从稀疏或噪声点云中重建几何CAD模型[55,56]。例如,Yu 等人 [57] 使用基于深度学习的分割和BIM驱动的对齐技术,从扫描质量较差的3D点云数据中重建管道结构。BIM(建筑信息模型)是一种三维数字建模方法,集成了建筑几何、物理和功能信息,支持建筑全生命周期的管理与协作[58,59]。
在从点云到CAD模型的重建任务中,尽管现有方法在参数化建模、几何结构表达以及特定场景下低质量点云的重建方面取得了进展,但仍然受到点云高噪声、分布不均匀等因素的限制,重建精度难以保证[60,61]。同时,对于复杂结构和工业零部件的表达能力有限,并且几何约束建模与实际CAD系统的集成尚不成熟[62,63]。未来,可以集成几何先验、拓扑约束和多模态信息,构建更统一、可解释的重建模型,以提高系统的鲁棒性和工业适应性。
3. 从草图重建CAD模型
在将草图转换为CAD模型的传统方法中,设计者首先完成草图,然后通过高精度且可编辑的CAD工具将设计草图转换为3D CAD模型。由于涉及多种专业技能,这一过程在设计迭代中往往效率低下,需要耗费大量时间和资源[64]。因此,通过草图生成CAD模型的研究具有重要意义[65,66]。
在近期的研究中,Li 等人 [67] 提出了一个基于草图的CAD建模系统 Sketch2CAD。通过从草图操作中推断CAD操作,可以将人造物体的近似草图转换为规范的CAD模型[68]。对于用户而言,上下文用户绘制的草图笔触被映射到规范的CAD模型,帮助他们避免浏览复杂的CAD系统界面[69]。然而,该方法也存在局限性:即使它能使草图设计者快速生成CAD模型,却无法达到现代CAD软件相同的建模水平。这项研究为未来的研究提供了参考,并推动了草图到CAD模型转换的相关研究。
如果能够实现将2D CAD草图自动转换为3D CAD模型的过程,预计将显著提高从设计到实际应用的整体效率,并大幅降低成本[70]。基于这一需求,Hu 等人 [31] 提出了一个系统,使用矢量线图作为输入来生成结构化的CAD模型。该方法利用三个正交视图重建完整的3D CAD模型,特别是当输入包含显著噪声或信息缺失时,其表现优于传统方法[71,72]。这项研究有效解决了CAD领域一个长期存在的挑战:从多个正交视图重建3D几何体[73,74]。研究者发现有两个关键因素显著提升了重建效果:第一,与直接建立二维到三维的映射关系相比,引入注意力机制可以增强模型对不完整输入的适应性[75];第二,将专业领域知识注入生成框架可以提高输出质量,并增强其在后续任务中的实用价值。这一发现为后续相关研究提供了有力的理论支持。然而,该方法尚未集成CAD图纸中常见的附加信息,如图层、注释、符号和文本[76,77],这在一定程度上限制了其实用性。
近年来,从草图到CAD模型的转换研究在鲁棒性和生成质量方面取得了一些初步成果。然而,现有方法在多视图信息融合、图纸语义和几何结构一致性方面仍然存在不足[78]。未来,可以集成图层、符号语义和多模态输入,构建统一的草图到CAD框架,并引入用户交互机制,以提高系统的智能建模能力和实际效率,从而推动设计过程向智能化方向发展。
4. 从其他形式重建CAD模型
CAD 建模描述了用户创建 3D 形状的过程,这些形状与网格和点云截然不同,广泛应用于许多工业工程设计领域。随着近年来的发展,CAD 模型已被大多数工业制造过程广泛采纳为形状描述的标准方式。3D CAD 模型的生成面临着 CAD 操作序列和不规则结构的挑战。
Wu 等人 [10] 提出了首个将形状描述为一系列计算机辅助设计(CAD)操作的 3D 生成模型。他们发现了协调 CAD 模型中不规则性的一种表示方式。作者提出的 CAD 深度生成模型是 CAD 工具中用于构建 3D 形状的一系列操作。这些操作可以直接转换为其他形状格式,例如点云 [79] 和多边形网格 [80]。为了提高生成过程的可控性和层次化表达能力,Xu 等人 [81] 引入了一种分层神经编码器(HNC)架构,以实现更精细、结构化的 CAD 模型序列生成。同时,Li 等人 [26] 设计了一种端到端的方法(SECAD-Net),能够从输入的原始几何体中自动推断 2D 草图及其对应的 3D 拉伸参数,从而实现 CAD 模型的重建。此外,Yu 等人 [82] 提出了 CAPRI-Net,能够从 3D 曲面数据中自适应地学习和组装参数化几何体,以生成 CAD 模型。该方法为 CAD 模型生成提供了新的思路。
Geometry 等人 [83] 提出了 CSGNet,它以体素化形状为输入,并学习生成一系列构造实体几何(CSG)操作。相比之下,Wu 等人 [10] 设计了一个自编码器架构,输出以 CAD 操作序列表示的建模结果。
Xu 等人 [84] 提出了 BrepGen,这是一个基于扩散的生成框架 [85],可以直接生成边界表示(B-rep)形式的 CAD 模型。B-rep 的生成比 CSG 或草图表示更具挑战性 [86],主要原因是它们包含多种参数化曲面和曲线,每种几何元素都有其自身的定义和参数配置。为了形成封闭实体,所有几何形状之间的拓扑关系必须保持正确。因此,其生成非常复杂。因此,其他 CAD 生成模型使用参数化建模操作并扩展二维截面来进行操作,而无需通过 B-rep 生成。能够直接生成边界表示的系统的出现将产生巨大影响,减少熟练设计人员的大量手工劳动,降低 CAD 对专业 CAD 软件的依赖,并改变整体的 CAD 工作流程。因此,BrepGen 的出现将推动构建能够直接生成 B-rep 的自动化系统这一目标。
从体素和几何形状生成 CAD 模型在操作序列建模和 B-rep 模型直接生成方面显示出潜力。然而,在泛化性和可解释性方面仍然存在不足 [82,87]。未来,通过引入结构先验、多模态融合和设计规则约束,可以提高模型对复杂形状的表达能力,并加强与 CAD 工具链的联系,推动模型在实际工程设计中的应用。
5. CAD 草图的设计与生成
由于关于 3D CAD 重建的研究相对较少,我们也对 2D CAD 草图的重建与生成进行了调研。
在计算机辅助设计(CAD)中,一种常见的方法是通过拉伸和组合二维草图来获得复杂的三维模型。二维 CAD 模型的本质是一组通过某种关系(如共线、平行和相切)组合起来的图元(如直线和圆弧)的集合 [88,89]。二维草图通过一系列 CAD 操作形成二维复杂形状。
在使用训练模型自动生成 CAD 草图时,面临着图形复杂性和模型异构性的挑战 [87,90]。Para 等人 [91] 提出了 SketchGen 框架,通过设计一种图元和约束的顺序语言来解决异构性问题。SketchGen 框架用于自动、完整地生成 CAD 草图,其中包含图元和约束。然而,SketchGen 模型具有自回归特性的缺陷,导致无法纠正序列前期的错误。
在 CAD 模型中,位于三维结构内部的二维草图难以制造。Ganin 等人 [92] 提出了一个用于自动草图生成的机器学习模型。通过将通用的语言建模技术与现有的数据序列化协议相结合,实现了复杂结构化对象的生成。
对于参数化草图,Seff 等人 [93] 提出了一种对参数化 CAD 草图进行建模和合成的方法。使用生成模型,通过对几何图元和约束进行自回归采样来合成 CAD 草图。该模型有望通过合成逼真的 CAD 草图来辅助机械设计工作。
对于工程草图,Willis 等人 [32] 提出了工程草图的生成模型:CurveGen 和 TurtleGen。两者都能生成曲线图元并生成逼真的工程草图,且无需使用草图约束求解器。生成的模型包含拓扑信息,可用于辅助约束和 3D CAD 建模任务。
工程草图生成中的另一种潜在方法是程序合成:利用神经网络和编程语言技术生成或推断表示几何形状的程序 [83]。
在 CAD 草图生成方面,现有研究通过图元建模、约束序列和程序合成等方式提升了其表达能力。然而,由于模型纠错能力弱以及对约束关系的建模不足,生成草图的精度和工程实用性仍然有限 [94,95]。未来,结合图神经网络、约束求解机制和语言引导,可以提高生成模型的可控性、结构完整性和系统集成度,从而增强其在工程设计场景中的实用价值。
6. CAD 数据表示

6.1 B-Rep(边界表示)
在计算机辅助设计(CAD)中,参数化曲线和曲面构成了建模基础的核心 [96]。B-rep(边界表示)是一种常见的 CAD 数据结构,用于将几何体编码为参数化形状及其拓扑关系,从而实现复杂且精确的 3D 建模 [97],如图 4 所示。它由面、边和顶点组成,并支持直线、圆弧、圆柱以及非均匀有理 B 样条曲线(NURBS)等曲面表达。它可以精确描述由 CAD 建模操作生成的复杂模型 [98]。CAD 用户可以直接操作 B-rep 的几何元素进行设计和修改。
B-rep(边界表示)在 CAD 中扮演着连接几何建模与实体建模的桥梁角色 [99]。几何建模侧重于使用数学方法描述物体的几何特征,如曲线、曲面及其空间分布 [100];而实体建模则进一步强调构建具有封闭体积和拓扑完整性的三维模型,以满足制造和工程的实际需求 [101]。B-rep 能够精确描述复杂曲面,同时确保模型的拓扑连贯性和封闭性。作为几何建模的一种表达方式和实体建模实现的基礎,它在 CAD 系统中连接两者的过程中发挥着关键作用。
尽管 B-rep 数据在 CAD 领域被广泛使用,但其在深度神经网络中的直接应用仍然面临诸多挑战 [28]。B-rep 包含多种几何和拓扑实体。形状与曲面类型之间的映射并非一一对应;其拓扑结构复杂,需要考虑各个几何单元之间的连接方式。在现代机器学习中,BRepGen、BRepNet 和 BRep-BERT 等算法都基于 B-rep [17,84,102]。然而,由于其复杂的数据结构,这仍然是一个重大挑战。为了将深度神经网络的最新进展应用于 CAD 软件,Jayaraman 等人 [16] 提出了一种 B-rep 数据的统一表示,使得 UV-Net 网络架构能够有效结合图像卷积神经网络和图卷积神经网络。尽管如此,B-rep 仍然存在无法利用其他可用信息(如边凸性和曲线类型)的局限性。
6.2 多边形网格
在 3D CAD 数据中,多边形网格表示是一种常见的方法,可用于表示复杂的 3D 形状 [103]。多边形网格数据由顶点(3D 空间中的点)、边(边连接两个顶点,表示几何图形的边界)和面(面由一组按特定顺序连接的顶点构成)组成 [104]。CAD 软件中的多边形网格数据表达了设计细节和复杂性,其应用涵盖 3D 建模、动画和游戏开发。多边形网格表示结合了几何和拓扑信息,具有能够精确描述复杂 3D 形状的特点。
与 B-rep 相比,多边形网格在数据结构上存在根本差异。多边形网格通过离散的三角形或多边形面片来近似物体表面,主要用于图形渲染和可视化,例如游戏和动画 [105];而 B-rep 使用参数化曲线和曲面来精确表示几何形状及其拓扑关系,广泛用于工程设计和制造。相比之下,B-rep 更适合结构建模和几何计算,具有更高的精度和更强的表达能力。
6.3 序列表示
序列表示将 CAD 模型的生成或编辑过程表示为一串顺序操作。与自然语言处理中的文本序列类似,序列记录了几何操作、构建步骤和参数作为时间序列,模型可以通过学习这些序列来生成 CAD 模型 [15,49,81]。具体来说,CAD 模型的构建过程通常涉及各种几何操作,例如绘制直线、绘制圆弧、旋转、拉伸等。每个操作都有其特定的参数,如操作的起点、终点、半径、角度等。序列表示按照执行顺序记录这些几何操作,形成一组操作指令。这样,每个指令(或序列中的元素)就代表一个特定的几何操作及其相应的参数,正如最近提出的大型 CAD 命令序列模型数据集 DeepCAD [10] 中所见。
与序列表示类似的还有 CAD 程序化建模和宏参数方法(MPA)。CAD 程序化建模通过规则、脚本或参数指令自动构建几何模型,是一种模型生成方法。它强调基于规则和参数的模型自动构建 [106]。宏参数方法(MPA)是实现 CAD 模型语义保存和交换的一条技术路径,强调模型在不同平台之间的一致性 [107]。CAD 程序化建模是一种建模思想和方法,而 MPA 是一种用于跨平台语义建模转换的工程解决方案。相比之下,序列表示是一种数据表示形式。它是一种表达 CAD 模型“构建历史”的方式,便于神经网络学习和建模,适用于模型生成和重建任务。
6.4 构造实体几何(CSG)
构造实体几何(CSG)是一种经典的 3D CAD 表达形式 [108],它通过对基本几何体(如立方体、球体、圆柱体等)应用布尔运算(包括并集、交集和差集)来逐步构建复杂的 3D 结构 [109]。其中,差集运算在建模过程中尤为重要,特别适用于设计孔和凸起结构。与直接记录边界信息的边界表示(B-Rep)不同,CSG(构造实体几何)通过布尔图元和操作构建表达式树,仅记录模型的构建过程,而不存储具体的边界几何体。因此,需要通过布尔求值过程将其转换为最终的几何体。CSG 表示由布尔图元和布尔运算组成。
CSG 通常以树结构进行建模,叶节点表示基本几何体,中间节点表示布尔运算或几何变换。其中,凸起(protrusion)是一种典型操作,通常通过并集实现。B-rep 通过顶点、边、面及其拓扑关系来描述物体的边界,更注重形状表面的细节表达,适用于需要高精度建模的场景。CSG 关注构建过程,而 B-rep 强调几何表达,两者可以相互补充。
CSG 与序列表示有本质区别。CSG 通过布尔运算组合基本几何体,关注几何体之间的逻辑关系,通常用操作树表示。序列表示通过草图和操作序列模拟真实的设计过程,涉及草图、约束设置和建模特征操作,具有更强的表达能力,更适合复杂的参数化建模,符合实际工程需求。
CSG 具有简洁的表达结构和灵活的修改性,广泛应用于机械设计、建筑建模等诸多领域。最近,Yu 等人 [110] 提出了 D2CSG 模型,能够在无监督学习框架下学习紧凑的 CSG 表达式,用于表示三维 CAD 形状。
6.5 草图表示
常见的草图表示包括矢量图形表示和图结构表示。
矢量图形是一种常见的草图表示形式,它使用数学方程(如线段、圆、样条曲线等)来定义图形的边界和形状。与像素图像不同,矢量图形在放大或缩小时不会失真,适用于 CAD 中的高精度几何表达。通过直接使用 CAD 草图中的矢量图形信息,包括点、线、圆弧等几何元素,将 CAD 草图中的几何元素转换为一系列特征向量,每个向量包含几何元素的类型、坐标和其他属性。矢量图形表示通常用于使用深度学习模型生成新的 CAD 草图或优化现有设计。然而,其挑战在于需要处理复杂的几何和拓扑关系,模型设计和训练更为复杂。
二维 CAD 草图表示为图结构,其中节点表示几何元素,边表示几何元素之间的关系。通过构建图,节点表示点、线、圆弧等几何元素,边表示几何元素之间的连接关系或约束关系 [111]。它可以自然地表示几何元素之间的拓扑关系,适用于图神经网络(GNN)[112]。例如,在 SketchGraphs 数据集 [113] 中,每个 CAD 草图都可以表示为一个图结构,其中节点表示几何元素(如直线、圆等),边表示这些元素之间的约束或关系。
7. 数据集
本节系统回顾了当前 CAD 领域主流的开源数据集。为了加深对本领域数据资源的理解,本研究以结构化表格的形式(表 1)展示了相关数据集的关键特征,包括发布年份、数据规模、表示类型等核心属性。此外,原始文献中提供的官方下载链接列于表 2,以确保研究数据的可追溯性和可重复性,方便后续研究者进行对比实验和算法验证。
表 1. 数据集汇总表。 我们收集了相关论文中使用的数据集,并解释了它们的一些属性。
| 数据集 | 年份 | 模型规模 | 包含特征 | B-Rep | 网格 | 序列 | CSG | 草图 |
|---|---|---|---|---|---|---|---|---|
| ShapeNetCore | 2015 | 51,300 | 类别标注 | - | ✓ | - | - | - |
| CSGNet Synthetic Dataset | 2018 | 23,500 K | 程序表达式形式 | - | - | - | ✓ | - |
| ABC | 2019 | 1,000,000+ | 参数化描述 | ✓ | ✓ | - | - | - |
| SketchGraphs | 2020 | 15,000,000 草图 | 几何约束图标注 | - | - | ✓ | - | ✓ |
| CC3D | 2020 | 50,000+ | 无类别限制 | ✓ | ✓ | - | - | - |
| DeepCAD | 2021 | 178,238 | CAD 操作命令序列标注 | - | - | ✓ | - | - |
| Fusion 360 Gallery reconstruction | 2021 | 8,625 | 构建历史 | ✓ | ✓ | ✓ | - | ✓ |
| MFCAD++ | 2022 | 59,655 | 加工特征标注 | ✓ | - | - | - | - |
| CC3D-ops | 2022 | 37,000+ | 操作与步骤标签 | ✓ | ✓ | ✓ | - | - |
| Fusion 360 Gallery assembly | 2022 | 8,251 个装配体 / 154,468 个零件 | 装配信息标注 | ✓ | ✓ | - | - | - |
| Furniture Dataset | 2024 | 6,171 | 类别标注 | ✓ | - | - | - | - |
表 2. 数据集及下载链接。 我们提供了相关论文中所用数据集的下载链接。
| 数据集 | 下载网址 |
|---|---|
| ShapeNetCore | http://www.shapenet.org (accessed on 30 March 2025) |
| CSGNet Synthetic Dataset | https://hippogriff.github.io/CSGNet (accessed on 30 March 2025) |
| ABC | https://deep-geometry.github.io/abc-dataset (accessed on 30 March 2025) |
| CC3D | 论文未提供 |
| CC3D-ops | https://cvi2.uni.lu/cc3d-ops/ (accessed on 30 March 2025) |
| Fusion 360 Gallery Reconstruction | https://github.com/AutodeskAILab/Fusion360GalleryDataset (accessed on 30 March 2025) |
| MFCAD++ | https://pure.qub.ac.uk/en/datasets/mfcad-dataset (accessed on 30 March 2025) |
| DeepCAD | https://github.com/ChrisWu1997/DeepCAD (accessed on 30 March 2025) |
| Fusion 360 Gallery Assembly | https://github.com/AutodeskAILab/Fusion360GalleryDataset (accessed on 30 March 2025) |
| SketchGraphs | https://github.com/PrincetonLIPS/SketchGraphs (accessed on 30 March 2025) |
| Furniture Dataset | https://github.com/samuxxiang/BrepGen (accessed on 30 March 2025) |
7.1 ShapeNetCore 数据集
Chang 等人 [7] 构建的 ShapeNet 数据集收集了大量的 3D 模型,涵盖了许多常见类别,如家具、交通工具和电子设备。尽管 ShapeNet 包含许多 CAD 模型,但其初衷并非专门服务于 CAD。ShapeNetCore 是 ShapeNet 的一个子集,专注于结构相对规整且具有 CAD 特征的模型。该子集为计算机视觉和机器学习领域的研究提供了丰富的数据支持,可应用于物体识别、检索和分类等任务。尽管 ShapeNetCore 并非为工业级 CAD 而构建,但其模型资源对于许多 CAD 相关课题仍具有重要的实用价值。
在近期相关研究中,Yi 等人 [114] 提出了一种标注工具,对数据集进行标注,使其规模比以往可用的数据集大一个数量级以上。该标注工具在 ShapeNetCore 上进行了测试,显著降低了标注工作的人力成本。
7.2 CSGNet 合成数据集
Sharma 等人 [11] 提出了 CSGNet 合成数据集。该数据集由 CSG 程序自动生成的 2D 和 3D 形状组成。该合成数据集以程序表达式的形式提供,而非渲染图像。
7.3 ABC 数据集
Koch 等人 [8] 提出了 ABC 数据集。由于当时大量的数据集由获取或合成的点云或点网格组成,它们不满足真值信号或参数表示的要求。因此,提出了一个新的 CAD 模型数据集 ABC。它满足大规模、真值信号、参数表示和可扩展性的要求。它包含足够的相似样本、多样的形状和高质量的真值。
ABC 数据集 [8] 通过收集和创建 Onshape(一个大型在线 CAD 模型集合)而构建,可用于研究几何深度学习方法及其应用。ABC 数据集包含超过 100 万个独立且高质量的 CAD 模型。模型中采样曲面和曲线的参数描述可以生成不同格式和分辨率的数据,以便对各种几何学习算法进行公平比较。由于 ABC 数据集是 Onshape CAD 软件提供的专有格式,它包含一些额外的构建信息;但缺失的信息需要通过查询 Onshape API(Onshape API 版本 2024)来检索。
7.4 CC3D 数据集
Cherenkova 等人 [48] 构建了一个名为 CC3D 的数据集,其中包含超过 50,000 个 3D 物体及其对应的 CAD 模型和网格数据。该数据集涵盖了大量的真实 3D 扫描样本及其关联的 CAD 模型,为 3D 重建和几何分析等任务提供了宝贵的资源。CC3D 数据集包含无类别限制和复杂度限制的模型。CC3D 数据集收集的 3D CAD 模型总共包含 5 万多个 STEP 格式的模型,其类别和设计从简单到复杂不等。
7.5 CC3D-Ops 数据集
Dupont 等人 [115] 提出了 CC3D-ops 数据集,该数据集包含超过 37,000 个 CAD 模型,并建立在之前的 CC3D 数据集 [48] 之上。CC3D 数据集中的 CAD 模型附有每个模型构建过程的详细记录,包括操作的类型和步骤,这些记录来源于模型的实际构建历史。因此,CC3D-ops 数据集中的 B-rep 数据不仅包含相应的几何曲面信息,还提供了操作类型和步骤的详细标注。
与其他数据集相比,CC3D-ops 数据集同时具有 B-rep 和标准格式的清晰构建历史。这一优势仅在 CC3D-ops 数据集和 Fusion360 数据集 [9] 中具备,但 CC3D-ops 数据集的复杂模型特征比 Fusion360 数据集更接近真实的工业应用。CC3D 数据集 [48] 提供的 5 万多个工业 CAD 模型没有构建步骤和 B-rep。
7.6 Fusion 360 Gallery 重建数据集
Willis 等人 [9] 提出了 Fusion 360 Gallery 重建数据集,这是首个为机器学习设计的人工 3D CAD 几何数据集。该数据集包含 8,625 个人工设计序列(即 CAD 程序),这些序列操作简单,仅涉及草图和拉伸建模。通过基本的 CAD 建模操作和布尔运算,可以创建各种复杂的 3D 设计。
相比之下,许多现有的 3D CAD 数据集侧重于提供网格几何表示 [7,116,117]。然而,参数化 CAD 的标准格式是边界表示(B-Rep),它提供了更丰富的曲面和曲线分析。Fusion 360 Gallery 重建数据集使用 B-Rep 格式,不仅便于精细控制 3D 形状,还记录了清晰的设计构建历史,为分析和建模提供了宝贵的信息。
7.7 MFCAD++ 数据集
Colligan 等人 [118] 提出了一个新的加工特征数据集 MFCAD++。MFCAD++ 数据集基于 MFCAD 数据集,包含 59,655 个具有平面和非平面加工特征的 CAD 模型。该数据集中的每个 CAD 模型包含 3 到 10 个加工特征以及非平面加工特征,并且 CAD 模型非常复杂。至于 MFCAD 数据集 [119],它由 15,488 个 CAD 模型组成,每个 CAD 模型由一个初始立方体和 16 个平面加工特征类生成。然而,MFCAD 数据集存在局限性:每个 CAD 模型相对简单,且缺乏相交的加工特征。
7.8 DeepCAD 数据集
Wu 等人 [10] 提出了一个新的 CAD 命令序列数据集,用于训练他们提出的自编码器。该数据集包含 178,238 个 CAD 模型及其 CAD 构建序列。数据集中的每个模型都表示为一个 CAD 命令序列。与现有其他同类数据集相比,其规模大了几个数量级。与 ABC 数据集相比,ABC 数据集中的 CAD 以 B-rep 格式提供,且没有足够的信息来恢复 CAD 操作是如何构建设计的。与仅包含 8,000 个 CAD 的 Fusion 360 Gallery 数据集相比,它难以支持训练有效的泛化生成模型。因此,ABC 数据集和 Fusion 360 Gallery 数据集无法用于训练所提出的自编码器模型。然而,新提出的数据集规模足够大,并且提供了 CAD 命令序列,这使得它足以训练他们的自编码器网络,并可用于未来的研究。
7.9 Fusion 360 Gallery 装配数据集
Willis 等人 [120] 提出了 Fusion 360 Gallery 装配数据集,该数据集包含大量 CAD 装配体,并提供了有关接头、接触面、孔以及底层装配结构的详细信息。该数据集基于 Autodesk Fusion 360 中的设计,分为两部分:装配体数据(包括 8,251 个装配体和 154,468 个零件)和接头数据(包含 32,148 个连接 23,029 个零件的接头)。数据的结构和表示遵循 Fusion 360 API 规范。与同样使用 B-Rep 格式的 ABC 数据集相比,Fusion 360 Gallery 装配数据集的一个显著优势是它包含有关零件连接和约束的接头信息,这对于理解零件之间的关系至关重要。其他仅提供几何零件数据的 B-Rep 数据集缺乏此类装配信息 [9]。因此,Fusion 360 Gallery 装配数据集更真实地反映了 CAD 组件在设计过程中的实际使用情况。
7.10 SketchGraphs 数据集
“草图”(sketch)是 CAD 领域的一个术语,特指 3D CAD 模型的 2D 基础,它存储几何图元和施加的约束。Seff 等人 [113] 提出了一个包含从真实 CAD 模型中提取的 1500 万个草图的数据集:SketchGraphs 数据集。SketchGraphs 数据集是一个 CAD 草图数据集,专注于关系几何底层的参数化 CAD 草图。数据集中的每个草图都附有一个表示其配置的真实几何约束图。SketchGraphs 数据集包含从云 CAD 平台 Onshape 上托管的参数化 CAD 模型中提取的 1500 万个参数化 CAD 草图。在现有的以体素或网格表示 3D 几何的 CAD 数据集中 [7,116],这些模型在参数化设计环境中不可修改,因此无法直接用于大多数工程工作流程。SketchGraphs 数据集中的模型是参数化 CAD 模型,可以支持分块分割和法线估计等任务。
7.11 家具数据集
Xu 等人 [84] 提出了 Furniture B-rep 数据集,这是第一个包含由人类设计的 3D CAD 模型的数据集。它们以 B-rep 格式表示。它包含 10 个常见家具类别的 6,171 个 B-rep CAD 模型。该数据集具有标准的类别标签和包含自由曲面的 3D 模型。
8. 评估指标
在本节中,我们将介绍不同论文中针对不同任务的评估指标。我们将分别进行介绍,涵盖点云、草图和其他形式的转换任务。
8.1 从点云到CAD模型的重建
Uy 等人 [30] 提出的 Point2Cyl 将原始 3D 点云转换为一组拉伸柱体的 CAD 模型。以下评估指标用于评估该算法的不同方面。具体参数值如表 3 所示。
表 3. Point2Cyl 与强几何基线 jet fit (NJ) 以及简单手工基线 H.V. 的对比。 ↑:越高越好,↓:越低越好。
| 方法 | 发表会议 | 数据集 | Seg. ↑ | Norm. ↓ | B.B. ↑ | E.A. ↓ | E.C. ↓ | Fit Cyl ↓ | Fit Glob ↓ |
|---|---|---|---|---|---|---|---|---|---|
| Point2Cyl [30] | CVPR’22 | Fusion Gallery | 0.736 | 8.547 | 0.911 | 18.137 | 0.0525 | 0.0704 | 0.0305 |
| H.V.+NJ [121] | - | Fusion Gallery | 0.409 | 12.264 | 0.595 | 58.868 | 0.1248 | 0.1492 | 0.0683 |
| Point2Cyl | CVPR’22 | DeepCAD | 0.833 | 8.563 | 0.919 | 7.923 | 0.0267 | 0.0758 | 0.0308 |
| H.V.+NJ | - | DeepCAD | 0.540 | 13.573 | 0.577 | 59.785 | 0.0435 | 0.1664 | 0.0459 |
- 分割 IoU (Seg.):使用匈牙利算法将预测的拉伸段与实际拉伸段进行匹配。将分割结果与真实标签进行比较。总 IoU 损失 (RloU loss) 定义如下:
1 K ∑ k = 1 K R o I U ( 1 ( W ^ : k ) , W : k ) ( 1 ) \frac{1}{K}\sum_{k = 1}^{K}\mathrm{RoIU}(1(\hat{W}_{:k}),W_{:k}) \qquad (1) K1k=1∑KRoIU(1(W^:k),W:k)(1)
其中 1 ( ⋅ ) 1(\cdot) 1(⋅) 表示独热编码。
- 法向角度误差 (Norm.):测量预测法向与真实法向之间的角度一致性。使用以下定义公式计算平均误差:
1 N ∑ i = 1 N cos − 1 ( 1 ( N ^ i : T N i : ) ) ( 2 ) \frac{1}{N}\sum_{i = 1}^{N}\cos^{-1}\left(\mathbf{1}(\hat{\mathbf{N}}_{i:}^{T}\mathbf{N}_{i:})\right) \qquad (2) N1i=1∑Ncos−1(1(N^i:TNi:))(2)
- 基座/筒体分类准确率 (B.B.):计算正确预测的基座和筒体标签的比例。如果真实标签与预测标签一致,则计入。公式如下:
1 N ∑ i = 1 N 1 ( B ^ i = B i ) ( 3 ) \frac{1}{N}\sum_{i = 1}^{N}\mathbf{1}(\hat{\mathbf{B}}_i = \mathbf{B}_i) \qquad (3) N1i=1∑N1(B^i=Bi)(3)
- 拉伸轴角度误差 (E.A.):测量真实轴与预测轴之间的角度误差。公式如下:
1 κ ∑ k = 1 K cos − 1 ( 1 ( e ^ k T e k ) ) ( 4 ) \frac{1}{\kappa}\sum_{k = 1}^{K}\cos^{-1}\left(\mathbf{1}(\hat{\mathbf{e}}_{k}^{T}\mathbf{e}_{k})\right) \qquad (4) κ1k=1∑Kcos−1(1(e^kTek))(4)
- 拉伸中心误差 (E.C.):测量真实中心与预测中心之间的距离:
1 K ∑ k = 1 K ∥ e ^ k : − e k : ∥ 2 ( 5 ) \frac{1}{K}\sum_{k = 1}^{K}\| \hat{\mathbf{e}}_{k:} - \mathbf{e}_{k:}\|_{2} \qquad (5) K1k=1∑K∥e^k:−ek:∥2(5)
- 每个拉伸柱体的拟合损失 (Fit Cyl.):衡量每个无约束拉伸柱体参数对真实拉伸柱体段的拟合程度:
1 K ∑ k = 1 K ∣ F = ∑ s i ∈ S ^ k S ( f ρ ^ ( S ^ k ) , s i ) ∣ ( 6 ) \frac{1}{K}\sum_{k = 1}^{K}\left|\mathcal{F} = \sum_{s_i\in \hat{S}_k}S(f_{\hat{\rho}}(\hat{S}_k),s_i)\right| \qquad (6) K1k=1∑K F=si∈S^k∑S(fρ^(S^k),si) (6)
其中 s k s_k sk 是投影拉伸参数后的段点。
- 全局拟合损失 (Fit Glob.):衡量是否至少有一个预测的无约束拉伸柱体能够解释每个筒体点:
1 ∣ P b a r r ∣ ∑ p i ∈ P b a r r min k = { 1 , … , K } ∣ S ( f ρ ^ ( S ^ k ) , q i ) ∣ ( 7 ) \frac{1}{|\mathbf{P}_{\mathrm{barr}}|}\sum_{\mathbf{p}_i\in \mathbf{P}_{\mathrm{barr}}}\min_{k = \{1,\dots,K\}}|S(f_{\hat{\rho}}(\hat{\mathbf{S}}_k),\mathbf{q}_i)| \qquad (7) ∣Pbarr∣1pi∈Pbarr∑k={1,…,K}min∣S(fρ^(S^k),qi)∣(7)
其中 q i = s ^ k Π ( p i , e ^ k , e ^ k ) \mathbf{q}_i = \hat{s}_k\Pi (\mathbf{p}_i,\hat{\mathbf{e}}_k,\hat{\mathbf{e}}_k) qi=s^kΠ(pi,e^k,e^k)。
Yang 等人 [49] 提出的 PS-CAD 模型从点云数据重建 CAD 建模序列。使用表 4 中所示的评估指标来评估该算法的不同方面。
- 倒角距离 (CD):通过比较两个形状表面上随机采样点到最近对应点的平均距离,来衡量几何相似性。
- 豪斯多夫距离 (HD):取两个形状之间所有随机采样点对中距离最远的一对,反映它们之间的最大几何偏差。
- 边缘倒角距离 (ECD):计算两个 CAD 模型边缘上点之间的平均最近距离,以表征轮廓结构的接近程度。
- 法向一致性 (NC):计算对应法向量之间的相似性,通常通过余弦相似度来衡量。
- 无效比率 (IR):统计生成的 CAD 操作序列中无法执行的比例,表示建模过程的有效性。
表 4. 不同方法在两个不同数据集上的几何指标(CD、HD、ECD、NC 和 IR)的定量比较。 CD、HD 和 ECD 的比例尺为 10 2 10^{2} 102。↑:越高越好,↓:越低越好。
| 方法 | 数据集 | CD ↓ | HD ↓ | ECD ↓ | NC ↑ | IR (%) ↓ |
|---|---|---|---|---|---|---|
| DeepCAD [10] | DeepCAD [10] | 4.25 | 39.25 | 19.33 | 0.49 | 7.14 |
| HNC-CAD [81] | DeepCAD [10] | 1.09 | 20.23 | 5.94 | 0.75 | 0.32 |
| Point2cyl [30] | DeepCAD [10] | 1.00 | 20.93 | 20.45 | 0.73 | 0.0 |
| SECAD-Net [26] | DeepCAD [10] | 0.42 | 9.96 | 5.54 | 0.73 | 0.38 |
| PS-CAD [49] | DeepCAD [10] | 0.21 | 8.66 | 4.65 | 0.89 | 0.43 |
| HNC-CAD [81] | Fusion360 [9] | 1.38 | 20.61 | 9.24 | 0.52 | 0.33 |
| SECAD-Net [26] | Fusion360 [9] | 0.69 | 12.76 | 5.15 | 0.64 | 3.82 |
| PS-CAD [49] | Fusion360 [9] | 0.57 | 12.0 | 5.02 | 0.67 | 1.51 |
8.2 从草图到CAD模型的重建
关于从草图到 3D CAD 模型转换的研究较少,因此我们也调研了 CAD 草图的生成与重建。
8.2.1 从草图到 3D CAD 模型
Hu 等人 [31] 通过组合三个正交视图重建了 3D CAD 模型。使用精确率、召回率和 F1 分数评估 3D 重建结果的质量。Hu 等人将结果与基于三个正交视图的传统 3D 重建方法进行了比较。由于传统流程的实现未公开,他们基于先前的工作 [71,74] 重新实现了该流程。比较仅涉及具有可见边缘的输入,如表 5 所示。
- 精确率 (Precision):指模型预测为正类的样本中实际为正类的比例。
- 召回率 (Recall):衡量所有正类样本中被模型正确识别为正类的比例。
- F1 分数 (F1 score):精确率和召回率的调和平均值,综合了两者的性能。F1 分数范围从 0 到 1,1 表示最佳性能,0 表示最差性能。
表 5. Hu 等人的方法与基于三个正交视图的传统 3D 重建方法的比较。
| 方法 | 发表会议 | 精确率 | 召回率 | F1 分数 |
|---|---|---|---|---|
| Hu 等人 [31] | CVPR’23 | 84.12 | 82.05 | 82.62 |
| Sakurai 和 Shin 等人 [71,74] | - | 99.64 | 26.47 | 39.31 |
8.2.2 CAD 草图的生成式重建
在 CAD 草图的生成与重建研究中,Ganin 等人 [92] 提出了一个用于自动生成草图的机器学习模型。遵循自回归生成模型的标准评估方法 (Nash et al., 2020 [72]),使用对数似然作为主要定量指标。
- 对数似然 (Log-likelihood):通过计算模型生成观测数据的对数似然来度量模型预测的准确性。该值越高,模型预测数据越准确。
Seff 等人 [93] 提出了一种对参数化 CAD 草图进行建模和合成的方法。通过在拉伸测试集上测量负对数似然 (NLL) 和预测准确率,以及通过生成草图的分布统计来进行定量评估。
- 负对数似然 (NLL):对数似然的负值,常用于衡量模型预测与真实观测数据之间的偏差。NLL 值越小,模型预测越接近实际值。
- 预测准确率 (Predictive Accuracy):指模型在测试数据上正确预测的比例,用于衡量模型的整体预测性能。该值越高,模型性能越好。
Willis 等人 [32] 提出了工程草图生成模型,为后续参数化 CAD 模型的合成与组合提供了基础。模型的定量评估指标列于表 6 中。
- 每顶点比特数 (Bits per Vertex):测量每个测试样本顶点的负对数似然值,以比特表示。该值越低,性能越好。
- 每草图比特数 (Bits per Sketch):指每个草图的平均负对数似然,以比特表示。该值越低,模型性能越好。对于 CurveGen,我们报告顶点模型和曲线模型的比特数。
- 独特性 (Unique):衡量生成草图中独特草图的比例(占所有生成样本的比例)。
- 有效性 (Valid):衡量生成草图中有效草图的比例(占所有样本的比例)。无效草图包括那些无法拟合曲线、顶点超过四个或存在重复顶点的草图。
- 新颖性 (Novel):衡量生成草图中未出现在训练集中的新颖草图的比例(占所有生成样本的比例)。
表 6. 定量草图生成结果。
| 方法 | 参数数量 | 每顶点比特数 | 每草图比特数 | Unique % | Valid % | Novel % |
|---|---|---|---|---|---|---|
| CurveGen [32] | 2,155,542 | 1.75 / 0.20 | 176.69 / 30.64 | 99.90 | 81.50 | 90.90 |
| TurtleGen [32] | 2,690,310 | 2.27 | 54.54 | 86.40 | 42.90 | 80.60 |
| SketchGraphs [113] | 18,621,560 | - | 99.38 | 76.20 | 65.80 | 69.10 |
8.3 从其他形式到CAD模型的重建
8.3.1 其他形式到 B-Rep 3D CAD 模型的重建
对于 Xu 等人 [84] 提出的 BrepGen,直接输出生成的边界表示 (B-rep) CAD 模型,并通过分布指标和 CAD 指标定量衡量生成质量。分布指标包括覆盖率 (COV)、最小匹配距离 (MMD) 和 Jensen-Shannon 散度 (JSD)。CAD 指标包括新颖性 (Novel)、独特性 (Unique) 和有效性 (Valid),如表 7 所示。
表 7. BrepGen 在测试集上的定量生成结果。 ↑:越高越好,↓:越低越好。
| 方法 | 发表会议 | COV% ↑ | MMD ↓ | JSD ↓ | Novel% ↑ | Unique% ↑ | Valid% ↑ |
|---|---|---|---|---|---|---|---|
| BrepGen [84] | CVPR’24 | 71.26 | 1.04 | 0.09 | 99.8 | 99.7 | 62.9 |
| DeepCAD [10] | ICCV’21 | 65.46 | 1.29 | 1.67 | 87.4 | 89.3 | 46.1 |
- 覆盖率 (COV):在将每个生成数据点分配给其最近的真实数据点(基于倒角距离)后,至少有一个真实数据点与之匹配的生成数据点所占的比例。
- 最小匹配距离 (MMD):测量真实数据集中的每个数据点与其在生成数据中的最近邻之间的平均距离。
- Jensen-Shannon 散度 (JSD):在将点云数据转换为离散体素后,计算生成数据与真实数据之间的分布差异。
- 新颖性 (Novel):未出现在训练集中的生成数据所占的百分比。
- 独特性 (Unique):生成时仅出现一次的数据所占的百分比。
- 有效性 (Valid):生成的是封闭实体的 B-rep 数据所占的百分比。
8.3.2 从其他形式重建 3D CAD 模型
Wu 等人 [10] 提出了首个将 3D 形状生成建模为 CAD 操作序列的方法。该生成模型使用倒角距离 (CD) 作为评估指标之一,该指标广泛应用于许多基于离散表示(如点云)的生成模型 [122–124]。通过命令准确率 (ACCcmd) 和参数准确率 (ACCparam) 评估命令执行的准确性,同时考虑模型的效率。由于当时缺乏类似的 CAD 生成模型,作者引入了多个自定义变体进行对比实验,以验证其数据编码方法和训练方法的有效性。这些变体包括:Alt-Rel(用于表示曲线相对于循环中前一条曲线的位置)、Alt-Trans(在拉伸命令中添加循环起始位置和草图平面原点的位置信息)、Alt-ArcMid(使用圆弧的起点、终点和中点来定义圆弧曲线)、Alt-Regr(通过均方误差损失函数直接回归所有 CAD 命令参数)以及 DeepCAD + Aug(在训练阶段引入随机组合的 CAD 命令序列作为数据增强策略)。具体实验结果如表 8 所示。
表 8. DeepCAD 自编码器的定量评估。 ↑:越高越好,↓:越低越好。
| 方法 | ACCcmd ↑ | ACCparam ↑ | 中位 CD ↓ | 无效比率 ↓ |
|---|---|---|---|---|
| DeepCAD [10] + Aug | 99.50 | 97.98 | 0.752 | 2.72 |
| DeepCAD [10] | 99.36 | 97.47 | 0.787 | 3.30 |
| Alt-ArcMid | 99.34 | 97.31 | 0.790 | 3.26 |
| Alt-Trans | 99.33 | 97.56 | 0.792 | 3.30 |
| Alt-Rel | 99.50 | 97.66 | 0.863 | 3.51 |
| Alt-Regr | - | - | 2.142 | 4.32 |
- 倒角距离 (CD):计算两组点集之间的距离度量。常用于评估生成点云与真实点云之间的相似性。值越小,生成点云越接近真实点云。
- 命令准确率 (ACCcmd):衡量生成的 CAD 操作序列中每个操作被正确执行的比例。值越高,模型生成的 CAD 操作越准确。
- 参数准确率 (ACCparam):衡量生成的 CAD 操作参数(如尺寸、位置等)与真实值的接近程度。值越高,生成的 CAD 模型在参数上越接近真实设计目标。
- 无效比率 (Invalid Ratio):生成的 CAD 模型无法成功转换为有效点云的比例。它衡量模型生成的有效性。值越低,生成的 CAD 模型质量越高。
9. 结论
本文对基于深度学习的 CAD 重建进行了全面的综述。我们回顾了过去十年中发展的 CAD 模型重建方法,并根据输入类型(点云、草图或其他)对其进行了分类。我们还总结了各种 CAD 数据表示形式,并重点介绍了近期的工作,以反映当前的进展和研究趋势。此外,我们介绍了相关的公共数据集,以支持可重复性和基准比较。
本文重点关注点云重建、草图生成和表示建模等关键任务。我们从多个维度进行了系统分析,包括输入模态、表示方法、建模策略和评估指标。通过梳理研究现状并识别关键发现,我们构建了一个多任务知识框架,以弥补该领域缺乏统一和全面综述的不足。
在数据资源方面,我们对主流公共数据集和核心评估指标进行了结构化整理,以便于更好的可重复性和跨方法比较。尽管在参数化建模、结构表示和任务集成方面取得了显著进展,但挑战依然存在,例如高质量标注数据集的稀缺、跨模态建模能力有限以及处理复杂约束的困难。为了解决这些问题,我们建议未来的研究方向包括多源数据融合、结构先验的引入以及交互式建模机制的增强。
Transformer 架构、多模态融合和结构先验学习等新兴技术在提高模型的可控性、可解释性和实际适用性方面显示出巨大潜力。我们提倡未来的研究应侧重于构建统一的 CAD 重建框架,以增强系统集成和工业部署能力。总体而言,本文不仅总结了最先进的进展和关键挑战,还为推动基于深度学习的 3D CAD 重建迈向智能设计系统提供了清晰的研究路线图和方法论指导。
AtomGit 是由开放原子开源基金会联合 CSDN 等生态伙伴共同推出的新一代开源与人工智能协作平台。平台坚持“开放、中立、公益”的理念,把代码托管、模型共享、数据集托管、智能体开发体验和算力服务整合在一起,为开发者提供从开发、训练到部署的一站式体验。
更多推荐



所有评论(0)