感知器算法例题——随机梯度下降法

phoenix@Capricornus

803人浏览 · 2025-06-19 14:09:55

phoenix@Capricornus · 2025-06-19 14:09:55 发布

如图所示的训练数据集，其正样本是 $x1=(3,3)⊤\boldsymbol{x}_1 = (3,3)^\top$ ， $x2=(4,3)⊤\boldsymbol{x}_2 = (4,3)^\top$ ，负样本是 $x3=(1,1)⊤\boldsymbol{x}_3 = (1,1)^\top$ ，使用感知器算法的随机梯度法求判别函数 $f(x)=sgn(w⋅x+b)f(\boldsymbol{x}) = \text{sgn}(\boldsymbol{w} \cdot \boldsymbol{x} + b)$ 。

解答
构建最优化问题：

$\min_{\boldsymbol{w},b} L(\boldsymbol{w},b) = -\sum_{\boldsymbol{x}_i\in \mathcal{X}_k} y_i (\boldsymbol{w} \cdot \boldsymbol{x}_i + b)$
求解 $w\boldsymbol{w}$ ， $b$ 。 $α=1\alpha = 1$ 。

(1) 取初值 $w0=0\boldsymbol{w}_0 = 0$ ， $b_0 = 0$ ；

(2) 对 $x1=(3,3)⊤\boldsymbol{x}_1 = (3,3)^\top$ ， $y1(w0⋅x1+b0)=0y_1 (\boldsymbol{w}_0 \cdot \boldsymbol{x}_1 + b_0) = 0$ ，未能被正确分类，更新 $w\boldsymbol{w}$ ， $b$ ：

$\boldsymbol{w}_1 = \boldsymbol{w}_0 + y_1 \boldsymbol{x}_1 = (3,3)^\top \quad b_1 = b_0 + y_1 = 1$

得到线性模型：

$\boldsymbol{w}_1 \cdot \boldsymbol{x} + b_1 = 3{x}^{(1)} + 3{x}^{(2)} + 1$

(3) 对 $x1\boldsymbol{x}_1$ ， $x2\boldsymbol{x}_2$ ，显然， $yi(w1⋅xi+b1)>0y_i (\boldsymbol{w}_1 \cdot \boldsymbol{x}_i + b_1) > 0$ ，被正确分类，不修改 $w\boldsymbol{w}$ ， $b$ ；对 $x3=(1,1)⊤\boldsymbol{x}_3 = (1,1)^\top$ ， $y3(w1⋅x3+b1)<0y_3 (\boldsymbol{w}_1 \cdot \boldsymbol{x}_3 + b_1) < 0$ ，被错分类，更新 $w\boldsymbol{w}$ ， $b$ ：

$\boldsymbol{w}_2 = \boldsymbol{w}_1 + y_3 \boldsymbol{x}_3 = (2,2)^\top \quad b_2 = b_1 + y_3 = 0$

得到线性模型：

$\boldsymbol{w}_2 \cdot \boldsymbol{x} + b_2 = 2{x}^{(1)} + 2{x}^{(2)}$
如此继续下去，直到

$\boldsymbol{w}_7 = (1, 1)^\top, \quad b_7 = -3$

$\boldsymbol{w}_7 \cdot \boldsymbol{x} + b_7 = {x}^{(1)} + {x}^{(2)} - 3$

对所有数据点 $yi(w7⋅xi+b7)>0y_i(\boldsymbol{w}_7 \cdot \boldsymbol{x}_i + b_7) > 0$ ，没有错分类点，损失函数达到极小。

判别函数为 $f(x)=sgn(x(1)+x(2)−3)f(\boldsymbol{x}) = \text{sgn}({x}^{(1)} + {x}^{(2)} - 3)$ 。

迭代过程见表。

表求解的迭代过程

迭代次数	错分类点	$w\boldsymbol{w}$	$b$	$w⋅x+b\boldsymbol{w} \cdot \boldsymbol{x} + b$
0	-	0	0	0
1	$x1\boldsymbol{x}_1$	$3)^\top$	1	$3{x}^{(1)} + 3{x}^{(2)} + 1$
2	$x3\boldsymbol{x}_3$	$2)^\top$	0	$2{x}^{(1)} + 2{x}^{(2)}$
3	$x3\boldsymbol{x}_3$	$1)^\top$	-1	${x}^{(1)} + {x}^{(2)} - 1$
4	$x3\boldsymbol{x}_3$	$0)^\top$	-2	-2
5	$x1\boldsymbol{x}_1$	$3)^\top$	-1	$3{x}^{(1)} + 3{x}^{(2)} - 1$
6	$x3\boldsymbol{x}_3$	$2)^\top$	-2	$2{x}^{(1)} + 2{x}^{(2)} - 2$
7	$x3\boldsymbol{x}_3$	$1)^\top$	-3	${x}^{(1)} + {x}^{(2)} - 3$
8	0	$1)^\top$	-3	${x}^{(1)} + {x}^{(2)} - 3$

这是在计算中错分类点先后取 $x1,x3,x3,x3,x1,x3,x3\boldsymbol{x}_1, \boldsymbol{x}_3, \boldsymbol{x}_3, \boldsymbol{x}_3, \boldsymbol{x}_1, \boldsymbol{x}_3, \boldsymbol{x}_3$ 得到的分离超平面和判别函数。如果在计算中错分类点依次取 $x1,x3,x3,x3,x2,x3,x3,x1,x3,x3\boldsymbol{x}_1, \boldsymbol{x}_3, \boldsymbol{x}_3, \boldsymbol{x}_3, \boldsymbol{x}_2, \boldsymbol{x}_3, \boldsymbol{x}_3, \boldsymbol{x}_1, \boldsymbol{x}_3, \boldsymbol{x}_3$ ，那么得到的分离超平面是 $2x^{(1)} + x^{(2)} - 5 = 0$ 。

可见，感知器算法由于采用不同的初值或选取不同的错分类点，解可以不同。

AtomGit开源社区

AtomGit 是由开放原子开源基金会联合 CSDN 等生态伙伴共同推出的新一代开源与人工智能协作平台。平台坚持“开放、中立、公益”的理念，把代码托管、模型共享、数据集托管、智能体开发体验和算力服务整合在一起，为开发者提供从开发、训练到部署的一站式体验。

更多推荐

基于主从博弈的电热综合能源系统动态定价与能量管理（Matlab代码实现）

综合能源系统是由电、热、气、冷多种能源系统耦合而成的，相比于传统能源系统具有更多的能量转换装置和储能设备，其能量流动关系更加复杂，能源的调度分配与能源转换设备特性和能源价格差有很大关系，因此为了更好的对综合能源系统进行协调优化，需要更好的了解各设备的特性，本章介绍了燃气锅炉(Gas Boiler, GB)、余热锅炉（Heat Recovery Boiler, HR）、蒸汽轮机（Steam Turb