因子图 vs 图优化：傻傻分不清？本文彻底讲透两者的本质区别

行知SLAM

439人浏览 · 2026-03-13 10:35:40

行知SLAM · 2026-03-13 10:35:40 发布

因子图 vs 图优化：傻傻分不清？一张图讲透两者的本质区别
- 目录
- 1. 核心结论：它们根本不是一个层面的概念
- 2. 什么是图优化？
- 3. 什么是因子图？
- 4. 关键区别：建模语言 vs 求解算法
- 5. 直观类比：盖房子 vs 造家具
- 6. 实际系统中的关系
  - 6.1 因子图 → 图优化
  - 6.2 典型流程
- 7. 开源工具对比
  | 工具 | 类型 | 核心功能 | 代表算法 | 使用场景 |
  |------|------|----------|----------|----------|
  | g2o | 图优化库 | 求解通用图优化问题 | LM、高斯-牛顿 | ORB-SLAM后端 |
  | Ceres Solver | 优化库 | 求解非线性最小二乘 | LM、信赖域 | Cartographer、VINS |
  | GTSAM | 因子图库 | 构建+求解因子图 | iSAM、贝叶斯树 | LIO-SAM、VINS-Fusion |
  | iSAM | 增量平滑库 | 增量式求解因子图 | QR分解 | 大规模SLAM |
- 8. 总结：一张表看懂区别

1. 核心结论：它们根本不是一个层面的概念

因子图优化和图优化是SLAM（同步定位与地图构建）中常用的两种优化方法，它们在处理方式和应用场景上有显著区别。

图优化，也称为位姿图优化，是一种全局优化方法。它将所有的位姿点和观测数据构建成一个图，然后通过优化算法对整个图进行全局优化。每个节点代表一个位姿，每条边代表一个观测或运动约束。图优化的目标是通过调整节点的位置，使得所有边的误差最小化。这种方法适用于静态环境，但由于需要对整个图进行优化，计算量较大，处理速度较慢。

因子图优化是一种增量式的优化方法。它将SLAM问题表示为一个因子图，其中节点表示变量（如相机位姿和路标），边表示因子（如观测和运动约束）。因子图优化的核心思想是保留中间计算结果，每次加入新的观测或运动数据时，只对新增部分进行优化，而不需要重新计算整个图。这种方法可以显著减少计算量，提高处理速度，适用于动态环境。

因子图优化的一个重要特点是使用贝叶斯网络来表示概率关系，通过最大化后验概率来进行优化。具体来说，因子图优化通过构建误差模型和协方差矩阵，使用第三方库（如GTSAM）进行因子的添加、误差函数的构建和优化求解。

总结来说，图优化适用于静态环境，计算量大，处理速度慢；而因子图优化适用于动态环境，计算量小，处理速度快。选择哪种方法取决于具体的应用场景和需求。

这是SLAM初学者最容易混淆的概念之一。让我直接给出结论：

因子图是一种建模语言**（问题的表示方式）**
图优化是一种求解方法**（问题的求解方式）**

打个比方：

因子图就像建筑设计图——描述了房子应该建成什么样
图优化就像施工队——按照设计图把房子盖出来

它们的关系：因子图经过转化后，可以用图优化来求解。

2. 什么是图优化？

2.1 图优化的本质

图优化是指将优化问题表示为图的形式，然后通过数值方法求解。这里的"图"指的是由节点和边组成的图结构。

节点：待优化的变量（如相机位姿、路标点位置）
边：节点之间的约束（如观测方程、运动模型）

2.2 图优化的数学形式

图优化要解决的是非线性最小二乘问题：

$\min_{\mathbf{X}} \sum_{i,j} \| \mathbf{e}_{ij}(\mathbf{x}_i, \mathbf{x}_j) \|^2_{\boldsymbol{\Lambda}_{ij}}$

其中：

$\mathbf{X} = \{\mathbf{x}_1, \mathbf{x}_2, ..., \mathbf{x}_n\}$ 为所有节点
$\mathbf{e}_{ij}$ 为边 $ij$ 的误差函数
$\boldsymbol{\Lambda}_{ij}$ 为信息矩阵（权重）

2.3 图优化的求解过程

图优化的求解通常使用高斯-牛顿法或LM算法：

线性化：在当前估计值处对误差函数进行一阶泰勒展开
$\mathbf{e}_{ij}(\mathbf{X} + \Delta \mathbf{X}) \approx \mathbf{e}_{ij}(\mathbf{X}) + \mathbf{J}_{ij} \Delta \mathbf{X}$
构建正规方程：
$\mathbf{H} \Delta \mathbf{X} = -\mathbf{b}$
其中 $\mathbf{H} = \sum \mathbf{J}_{ij}^T \boldsymbol{\Lambda}_{ij} \mathbf{J}_{ij}$ ， $\mathbf{b} = \sum \mathbf{J}_{ij}^T \boldsymbol{\Lambda}_{ij} \mathbf{e}_{ij}$
求解线性系统：利用矩阵的稀疏性加速求解
更新： $\mathbf{X} \leftarrow \mathbf{X} + \Delta \mathbf{X}$
迭代直到收敛

2.4 图优化的代表工具

g2o：通用图优化库，ORB-SLAM使用
Ceres Solver：Google出品的非线性优化库，Cartographer、VINS使用
GTSAM：佐治亚理工开发的平滑与建图库，虽然后来主打因子图，但求解器本质是图优化

3. 什么是因子图？

3.1 因子图的本质

因子图是一种概率图模型，用于表示概率分布的因子分解结构。它来自图论和概率论的交叉领域。

因子图由两种节点组成：

变量节点（圆圈）：表示随机变量（如状态 $x_k$ ）
因子节点（方块）：表示因子函数（如观测概率 $p(z_k|x_k)$ ）

3.2 因子图的数学形式

因子图表示的是联合概率分布的因子分解：

$p(\mathbf{X} | \mathbf{Z}) \propto \prod_i f_i(\mathbf{X}_i)$

其中：

$f_i$ 为因子函数（对应各种约束）
$\mathbf{X}_i$ 为与该因子相连的变量

3.3 因子图的可视化表示

    ┌───┐    ┌───┐    ┌───┐
    │ f1│    │ f2│    │ f3│
    └─┬─┘    └─┬─┘    └─┬─┘
      │        │        │
    ┌─▼─┐    ┌─▼─┐    ┌─▼─┐
    │ x1│────│ x2│────│ x3│
    └───┘    └───┘    └───┘
      │        │        │
    ┌─▼─┐    ┌─▼─┐    ┌─▼─┐
    │ g1│    │ g2│    │ g3│
    └───┘    └───┘    └───┘

上排 $f_i$ ：运动模型因子（连接相邻位姿）
中间 $x_i$ ：位姿变量
下排 $g_i$ ：观测模型因子（连接位姿和路标）

3.4 因子图的代表工具

GTSAM：最著名的因子图库，实现了因子图的构建和增量求解
iSAM：增量平滑与建图库，基于因子图理论
Bayes Tree：因子图的贝叶斯网络形式，用于增量更新

4. 关键区别：建模语言 vs 求解算法

4.1 层面不同

维度	因子图	图优化
层面	建模层（Representation）	求解层（Solver）
本质	概率图模型	数值优化方法
来源	图论 + 概率论	数值分析 + 优化理论
作用	描述变量间的关系	求解具体的数值解

4.2 图的含义不同

因子图的"图"：

节点：变量节点 + 因子节点（两种类型）
边：表示变量属于某个因子
含义：概率依赖关系

图优化的"图"：

节点：全是变量节点（一种类型）
边：表示变量间的约束
含义：误差约束关系

4.3 求解方式不同

因子图的求解：

首先将因子图转化为贝叶斯网络（通过变量消元）
或者转化为矩阵形式（Hessian矩阵）
再调用数值优化器求解

图优化的求解：

直接构建正规方程 $\mathbf{H}\Delta \mathbf{x} = -\mathbf{b}$
求解线性系统
迭代更新

5. 直观类比：盖房子 vs 造家具

让我用一个生活化的类比帮你理解：

因子图 = 建筑设计图 + 材料清单

告诉你哪里要放柱子（变量）
哪里要有承重墙（因子约束）
房子应该建成什么样

图优化 = 施工队 + 施工方法

负责把设计图变成真实的房子
用混凝土浇筑（线性化）
用吊车吊装（求解线性系统）
反复测量调整（迭代）

关系：

你可以用施工队（图优化）去盖不同设计图（因子图）的房子
也可以用同一个设计图（因子图）让不同施工队（不同优化器）去盖

6. 实际系统中的关系

6.1 因子图 → 图优化

在SLAM系统中，两者的关系是这样的：

传感器数据 → 构建因子图（建模） → 转化为图优化问题 → 求解器求解 → 状态估计
                                      ↓
                                HΔx = -b 正规方程
                                      ↓
                               LM/高斯-牛顿迭代

6.2 典型流程

以LIO-SAM为例：

因子图构建阶段：

// 添加IMU预积分因子
graph.add(imuFactor);
// 添加激光里程计因子  
graph.add(laserFactor);
// 添加GPS因子
graph.add(gpsFactor);

转化求解阶段：

// 内部将因子图转化为优化问题
// 构建Hessian矩阵
// 调用LM算法求解
optimizer.optimize();

7. 开源工具对比

工具	类型	核心功能	代表算法	使用场景
g2o	图优化库	求解通用图优化问题	LM、高斯-牛顿	ORB-SLAM后端
Ceres Solver	优化库	求解非线性最小二乘	LM、信赖域	Cartographer、VINS
GTSAM	因子图库	构建+求解因子图	iSAM、贝叶斯树	LIO-SAM、VINS-Fusion
iSAM	增量平滑库	增量式求解因子图	QR分解	大规模SLAM

注意：GTSAM虽然主打"因子图"，但它内部实现了从因子图到数值优化的完整转换。它既提供了建模语言（因子图API），也提供了求解器（优化算法）。

8. 总结：一张表看懂区别

对比维度	因子图	图优化
本质定义	概率图模型，表示因子分解	数值优化方法，求解最小二乘
所属领域	图论 + 概率论	数值分析 + 优化理论
作用	描述"问题是什么"	解决"怎么求解"
节点类型	变量节点 + 因子节点（2种）	只有变量节点（1种）
数学基础	概率论、贝叶斯公式	线性代数、牛顿法
输出	概率分布表示	最优数值解
代表工具	GTSAM、BayesTree	g2o、Ceres Solver
SLAM中角色	后端建模框架	后端求解引擎

一句话终极总结：

因子图是"剧本"，图优化是"演员"——剧本规定了故事框架，演员负责把故事演出来。好的剧本（因子图）需要好的演员（图优化）才能呈现精彩的效果！

AtomGit开源社区

AtomGit 是由开放原子开源基金会联合 CSDN 等生态伙伴共同推出的新一代开源与人工智能协作平台。平台坚持“开放、中立、公益”的理念，把代码托管、模型共享、数据集托管、智能体开发体验和算力服务整合在一起，为开发者提供从开发、训练到部署的一站式体验。

更多推荐

具身智能正式落地工厂：智元精灵G2的2283次零失误意味着什么

AtomGit开源社区

产品经理如何用 AI 工具 10 倍提速原型验证？

产品经理在原型验证阶段面临的核心矛盾是：需求在快速变化，但交付原型的周期无法同步压缩。传统路径中，产品经理负责输出PRD和交互说明，设计师根据文档出稿，评审发现问题后返回修改，每次迭代都需要跨角色协作和等待。在这个过程中，以下三类成本被反复消耗：时间成本。一轮原型从提需到可评审，通常需要2到5个工作日。如果一个季度需要验证4到6个产品方向，光是原型制作就会占用大量排期。沟通成本。文字需求和最终设计

AtomGit开源社区

Java 大厂一面模拟：从类加载器到热点Key治理的连续压问

双亲委派模型是指类加载器在收到加载请求时，先委托父类加载器尝试加载，只有当父类无法完成时，才由自己加载。候选人：Tomcat 为每个 WebApp 创建 WebAppClassLoader，它优先自己加载 WEB-INF/classes 和 lib 下的类，只有找不到时才委托父加载器。本文将完整还原面试过程，包含 8 个主问题、4 条重点追问链，覆盖 JVM、Spring、MySQL、Redis、