AI:如果 AI 永远不忘记你,我们该如何保持“被遗忘的权利”?
你删掉了和 ChatGPT 的对话记录。
你在抖音设置里清空了“个性化数据”。
你注销了一个再也不用的 AI 修图 App 账号。
然后你松了口气:好了,AI 不记得我了。
——真的是这样吗?
今天,我带你拆解一个让技术专家都头疼的事实:对 AI 来说,“删除”和“忘记”是两件完全不同的事。
以及,在“被 AI 永生记住”的时代,我们普通人还能做些什么来拿回遗忘的权利。
一、为什么 AI “永远不会忘记你”?
先从电脑和 AI 的差别说起。
🖥️ 你的电脑:删除 ≈ 忘记
你在电脑上删掉一张照片,它去了回收站,清空回收站后,系统不再认得这张照片。
(虽然懂技术的人可以用工具恢复,但至少操作系统自己是忘了。)
🧠 AI 模型:删除 ≠ 忘记
AI 的“记忆”分两层:
-
存储层——数据库、日志、聊天记录(这部分你可以删除,大部分公司也允许删除)。
-
模型层——AI 的“大脑”,它通过学习大量数据(包括你的数据)形成了参数和权重。这个“大脑”一旦训练完成,就无法单独“抹去”你一个人的贡献。
一个简单的类比:
你参与了一万人一起画一幅巨型壁画。每个人贡献一笔。
壁画完成后,你后悔了,想“把我画的那一笔擦掉”。
但那一笔已经和其他人的笔触融合在一起,成了整幅画的纹理。
硬要擦,可能挖出个洞,毁了整幅画。
AI 模型就是那幅壁画。
二、三个真实场景:当你请求“忘记我”,会发生什么?
场景 1:你删除了 ChatGPT 对话 ✅ 部分有效
发生了什么:
-
对话从你的历史记录中消失,你再也看不到。
-
OpenAI 会在 30 天内从存储系统中物理删除该对话。
-
但是:如果你的对话此前已经被用于训练新模型(比如 GPT‑4 的训练数据可能包含了早期用户的对话),那么那个训练好的模型依然保留着你对话的“影响力”。
虽然模型不会逐字记住你的话,但它内部的概率分布已经因为你而发生了微调。
普通人的感受:
“我删了,AI 好像真的不再提那件事了。”
实际上不是“忘了”,而是没有单独的“你”可供回忆——模型没有一张名单写着“张三说过 X”。
风险:
如果你的对话中包含独特信息(比如“我是某某市人民医院的李医生,我的工号是 12345”),理论上攻击者可以通过成员推断攻击(membership inference attack)来猜测:“这个模型是不是用李医生的数据训练过?”——从而间接泄露你的存在。
场景 2:你要求某 AI 公司“删除我的所有数据” ⚠️ 非常困难
根据欧盟 GDPR(通用数据保护条例),你有“被遗忘权”(Right to be forgotten)。
但是,对于已经训练好的 AI 模型,法律上存在巨大的灰色地带。
真实案例(2023 年):
一位法国用户要求某大型 AI 公司从它的模型权重中删除他的个人数据。
公司回复:“我们无法直接从模型中删除单个数据点,因为模型不是数据库。除非我们重新训练整个模型——成本数百万美元——否则无法做到。”
最终监管机构也没能强制公司重训练,只是要求该公司未来训练时更谨慎。
技术上的解法(正在研究中,但尚未普及):
-
机器遗忘(Machine Unlearning):专门设计的算法,可以“擦掉”一小部分数据的痕迹,而不必重训整个模型。
目前只有少数前沿研究能处理小规模模型,大模型(如 GPT‑3 级别)还做不到。 -
差分隐私训练(Differential Privacy):在训练时加入噪声,使得任何单个人的数据对模型的影响极小。
如果你训练时用了差分隐私,那么删除请求就变得可行——因为移除一个人后模型几乎不变。
但代价是模型准确率会下降,商业公司不太愿意用。
场景 3:AI 推荐系统记住了“曾经的你” 🔁 最麻烦
你在三年前刚毕业时常看“租房攻略”“职场新人”。
现在你已经是部门主管,想看“团队管理”“领导力”。
但 AI 推荐系统每次打开还是给你推“合租注意事项”。
你做了:
清空了历史记录、点了“不感兴趣”。
效果:
短期有效,但推荐系统的模型基于长期统计特征。
你过去的几千次点击已经深深嵌入了模型对你这个“ID”的认知。
除非你换一个全新账号(切断所有历史链接),否则系统很难彻底忘记“你曾经是职场新人”。
例子:
抖音的推荐模型会给你打上百个隐式标签(#应届生 #租房 #北京)。
你清空记录,只是抹掉了原始行为日志,但模型已经学到的那些标签权重不会自动归零。
它们只会随着你新的行为慢慢衰减——但这个过程可能持续数周甚至数月。
三、给普通人的实用指南:如何行使你的“被遗忘权”?
虽然技术不完美,但你依然可以大幅提高 AI “忘记你”的概率,至少让商业化利用你的数据变得困难。
✅ 第一步:区分“可见删除”和“模型遗忘”
| 你想要的效果 | 能做到吗? | 怎么做 |
|---|---|---|
| 让 AI 公司看不到你的聊天记录 | ✅ 基本可以 | 使用平台的“删除对话”功能,并关闭“用于训练”选项 |
| 让 AI 公司无法把你的数据卖给第三方 | ✅ 可以 | 在隐私设置中关闭“个性化广告”和“数据共享” |
| 让 AI 模型内部忘记你的一句话 | ❌ 很难 / 不可能 | 目前无解,除非该公司采用差分隐私(极少见) |
结论:
把目标设为“让我的数据不再被未来滥用”,而不是“从模型大脑中彻底抹去”。前者你控制得住,后者等未来技术或法律。
✅ 第二步:主动选择“会遗忘”的 AI 服务
市面上已经有一些工具和服务在设计上就支持被遗忘权:
-
本地运行的开源模型(如 Llama 3、Mistral 的本地版)
你的数据不出你的电脑,不存在“服务器上的模型记得你”的问题。
适合处理敏感信息(医疗咨询、金融计算、孩子教育记录)。 -
提供“无训练”模式的在线 AI
例如,有些 AI 工具在付费套餐中承诺“你的对话不会用于训练模型”(OpenAI 的 API 默认不用于训练,但网页版 ChatGPT 会用到)。
仔细看隐私政策里的“用于模型改进”条款。 -
支持数据过期政策的平台
例如,某些笔记类 AI 助手(如 Mem、Reflect)允许你设置“对话 30 天后自动删除”,并且不用于训练。
✅ 第三步:给 AI 公司发一封“遗忘请求信”
如果某个 AI 服务向你收集了敏感信息,而你怀疑它仍在你不知情下使用,可以尝试发送正式请求(尤其适用欧盟或加州的用户)。
模板(可复制修改):
致 [公司名] 隐私团队:
根据 [GDPR / CCPA / 个人信息保护法] 赋予我的被遗忘权,我正式请求您删除所有与我相关的个人数据,包括但不限于:
我的对话历史、上传文件
任何已用于模型训练的我贡献的数据(若技术上可行)
任何与我的账户关联的匿名化画像
我的账户 ID:[填写]
注册邮箱:[填写]请在 30 天内书面回复确认删除结果,并告知我是否已从模型影响中隔离我的数据。
此致
效果:
大公司收到这类法律指向的请求,通常会认真对待,至少会从存储层彻底删除你的记录。
对于“模型层”,他们可能回复“无法执行”,但这个过程本身会推动公司记录你的诉求,未来监管收紧时他们会更谨慎。
✅ 第四步:培养“数字失忆”习惯
-
每周清理一次聊天历史(减少被用于未来训练的可能)。
-
不要把所有秘密交给同一个 AI:
-
用 AI 写工作总结?可以。
-
问 AI “我孩子的真实姓名、学校、病历”?绝对不要。
-
-
使用一次性或匿名账户:
对于尝试性的 AI 工具,用临时邮箱注册,不要用手机号绑定。用完即弃。
四、未来展望:我们能期望什么?
技术界和法律界正在推动两条路径:
-
技术路径:
-
机器遗忘算法逐渐成熟,未来 5‑10 年可能成为主流 AI 的标配。
-
隐私计算(如联邦学习、可信执行环境)让 AI 在不“记住”你原始数据的前提下提供服务。
-
-
法律路径:
-
欧盟 AI 法案已经要求高风险 AI 系统必须支持删除个人数据对模型的影响。
-
中国《个人信息保护法》第四十七条明确赋予删除权,但如何执行到“已训练的模型”仍在司法解释中。
-
乐观估计:
2030 年前后,当你对一个 AI 说“忘记我”,它会在后台启动机器遗忘进程,几小时后回复:“已遗忘。”
悲观现实:
在那之前,我们仍然要和“永不遗忘的 AI”共处。
写在最后:遗忘是人性的一部分,也应当是 AI 的一部分
我们人类会忘记。
忘记前任的电话号码,忘记大学时出过的丑,忘记五年前犯下的错。
这种遗忘不全是缺陷——它让我们能重新开始。
AI 不一样。
它没有情绪负担,它不会尴尬,它会永远记得你某天深夜问过的那个愚蠢问题。
但正因为如此,我们才更需要为 AI 植入“遗忘”的能力——不是为了技术,而是为了尊严。
被遗忘权不是让你消失,而是给你选择:当你想重新开始时,AI 不会揪着你的过去不放。
现在,去看看你常用的 AI 应用里有没有“删除所有数据”的按钮。
点一下。
那是一个普通人在数字世界里,为数不多的、温柔的抵抗。
AtomGit 是由开放原子开源基金会联合 CSDN 等生态伙伴共同推出的新一代开源与人工智能协作平台。平台坚持“开放、中立、公益”的理念,把代码托管、模型共享、数据集托管、智能体开发体验和算力服务整合在一起,为开发者提供从开发、训练到部署的一站式体验。
更多推荐


所有评论(0)