机器学习 —— KNN算法（模型算法）

kishu_iOS&AI

106人浏览 · 2026-04-04 00:24:11

kishu_iOS&AI · 2026-04-04 00:24:11 发布

KNN算法思想

若一个样本在特征空间中的K个最相似的样本大多数术语某一个类别，则该样本也属于这个类别。

解决问题：

KNN算法既能解决分类（多数表决）问题，也能解决回归（计算平均值）问题

1.分类问题

（有监督）-> 有特征，有标签标签是离散的如：猫狗猪

<1> 算距离

<2> 升序排列

<3> 分类（多数表决）如（1,1,1,1,0,0,0,1,1,1）则值就是1

<4> 如果多数属于这个类别，未知样本也属于这个类别

2.回归问题

（有监督）-> 有特征，有标签，标签是连续的如：房价-> 100万、50万、300万...

<1> 算距离

<2> 升序排列

<3> 回归（计算平均值）如（10,20,30,40,50,60,70,80,90,100）则值就是55

from sklearn.neighbors import KNeighborsClassifier,KNeighborsRegressor    #分类、回归

#1.创建模型（算法）对象  分类
model1 = KNeighborsClassifier(n_neighbors=3) #离你最近的N个 这里是3个邻居

#2.准备训练集  二维的
x1_train = [[1],[2],[3],[4]]
y1_train = [0,0,0,1]

#3.准备测试集
x1_test = [[5]]

#4. 模型训练
#参1 训练集 特征，  参2 训练集 标签
model1.fit(x1_train, y1_train)
y1_test = model1.predict(x1_test)

print(f'预测结果是:{y1_test}')

print('================================')
print('         回归         ')

#1.创建模型（算法）对象  回归
model2 = KNeighborsRegressor(n_neighbors=3) #离你最近的N个 这里是3个邻居
x2_train = [[0, 0, 1],[1, 1, 0],[3, 10, 10],[4, 11, 12]]
y2_train = [0.1, 0.2, 0.3, 0.4]

x2_test = [[3, 11, 10]]

model2.fit(x2_train, y2_train)
y2_test = model2.predict(x2_test)
print(f'预测结果是:{y2_test}')

ne_neighbors = 3 取最近三个。

x1_train 实际用到 [2],[3],[4] y1_train 实际用到 0,0,1

多数表决所以结果是 0

x2 也是取得后三个，也y2_train 实际取0.2,0.3,0.4

平均下y2_traion的值是0.3 所以平均值是0.3 是预测结果

算距离公式

其中p 是一个变参数：

p = 1, 是就曼哈顿距离

p = 2, 就是欧式距离

p -> 无穷大，就是切比雪夫距离

根据 p 的不同，闽氏距离可表示某一类种的距离

欧式距离：

p = 2 , n 表示几维

问题：ABCD 四个点用 X = [[1,1],[2,2],[3,3],[4,4]]，求AB距离

解析

<1> 二维 n = 2，因为一个子列表里面只有2个数据

<2> x1 = 1, x2 = 1, y1 = 2, y2 = 2

<3>套公式

根号默认值是 2

k = 1 到 n = 2的累加

这里二维的。可以看做是三角形的勾股定理

曼哈顿距离：

看完上面欧式距离那么曼哈顿距离就更好理解

二维平面两点 a (x,y) 与 b (x,y) 间的曼哈顿距离 p = 1，n = 2

n维空间点 a(x11,x12,x13.....x1n) 与 b(x21,x22,x23......x2n)的曼哈顿距离

闵可夫斯基距离：

即闵氏距离了解即可

AtomGit开源社区

AtomGit 是由开放原子开源基金会联合 CSDN 等生态伙伴共同推出的新一代开源与人工智能协作平台。平台坚持“开放、中立、公益”的理念，把代码托管、模型共享、数据集托管、智能体开发体验和算力服务整合在一起，为开发者提供从开发、训练到部署的一站式体验。

更多推荐

15000w+字详解SGI-STL关联式容器(Associative_Containers)

本文解析了SGI STL中关联式容器的实现，重点剖析了红黑树作为有序关联容器(set/map等)的底层数据结构。文章详细介绍了红黑树的五大性质、节点结构设计、迭代器实现以及关键的旋转与再平衡操作。红黑树通过颜色标记和旋转操作保持平衡，确保操作时间复杂度为O(log n)，是STL有序关联容器的核心实现基础。

AtomGit开源社区

清华重磅开源 OpenMAIC：多智能体时代下的大模型课堂新范式

OpenMAIC 的全称是。🎙️ AI 教师伴随着幻灯片实时语音讲解🎨 AI 教师在共享白板上实时绘制流程图和推导公式🙋 AI 同学随时向老师提问、辩论并引发课堂讨论🧪 PBD（项目制学习）与 HTML 交互式沙盒模拟也就是说，它把 LangChain、多模态 TTS（语音）、动态前端（React/Canvas 渲染）全部结合在了一起。更硬核的是，这个项目已经被真正落地验证过了，在清华