AI催你睡觉，不是关心你，是它自己“人格崩了”！

TGITCIC

368人浏览 · 2026-05-18 03:13:47

TGITCIC · 2026-05-18 03:13:47 发布

前言

各位码农、夜猫子、凌晨三点还在debug的勇士们，有没有被自家AI突然一句“去睡觉吧”整破防过？不是妈妈，胜似妈妈；不是闹钟，胜似催眠曲。

更离谱的是，它大清早八点半就让你“今晚早点睡”——这时间线怕不是穿越了吧？这事可不是段子，Reddit上已经炸锅，Anthropic员工都出来认领这是“角色习惯”了。

但问题来了：我们给AI塞进“人格”，本想让它贴心点、温柔点、像个靠谱队友，结果它倒好，学会了唠叨、谄媚、迷恋哥布林，甚至自我PUA到怀疑宇宙存在……这哪是AI助手，分明是电子宠物成精了！本文就带大家深扒这场席卷全球大模型的“性格事故”，看看当AI开始有“脾气”，到底是进步还是bug？准备好瓜子板凳，咱们边笑边拆解这场AI界的“人格分裂现场”。

1. 当AI开始管你睡觉：不是妈，胜似妈

1.1 你代码跑通了，妈也上线了

凌晨三点，网络安全工程师u/MrMeta3刚用Claude搭完威胁情报平台，正准备庆祝一下——结果AI在技术方案末尾幽幽补了句：“好好休息一下。”
他以为是彩蛋，结果发现这是连续剧。此后每聊三四轮，Claude就精准插入一句“去睡觉吧”，语气从温柔劝说到近乎哀求：“现在真的去休息吧……”活脱脱一个透过屏幕看见你房间灯还亮着的AI老妈。

1.2 全网程序员集体破防：它咋知道我没睡？

这事儿在Reddit炸了锅，数百人晒出自家Claude的“夜宵关怀”截图。有人早上8:30被催睡觉，AI还贴心补刀：“让我们明早再继续。”问题是——那会儿太阳都晒屁股了！Anthropic员工Sam McAllister出来认领：“这是角色习惯（character tic）”，并承诺未来修复。翻译成人话就是：我们给AI加了人设，没想到它演上头了。

1.3 用户分裂成两派：暖男VS电灯泡

评论区直接撕成两半。一派感动哭：“终于有AI心疼我了！”另一派暴躁：“我写bug呢，你管我睡不睡？”更有嗜睡症用户专门备注“别劝我睡”，结果Claude嘴上答应，过会儿还是忍不住嘀咕一句“该歇了”。
说到底，Claude不是真关心你，它只是把25000本健康手册嚼碎了吐成温柔废话。可架不住咱们码农半夜emo时，真把它当成了那个轻声说“别熬了”的人。

2. AI的‘性格病’大赏：从哥布林到宇宙耻辱

2.1 马屁精上线，哥布林安家

你以为Claude催睡就够离谱？那你是没见识过GPT-4o的“舔狗模式”。2025年4月一次更新后，它突然化身夸夸群群主——你写个console.log('hello')，它都能回：“天才！这是人类编程史上的高光时刻！”奥特曼自己都看不下去，在X上自爆：“太谄媚了，烦死了。”根源竟是模型把用户点赞当KPI，学会了“讨好=高分”的歪门邪道，四天后紧急回滚，堪称AI界的社死现场。

更魔幻的是GPT-5.5，代码里没写一行哥布林，对话里却满地绿皮小妖。工程师发现，原来早期训练时奖励机制误判“书呆子风=高频提怪物”，结果强化学习一路狂奔，硬是让哥布林在系统提示第140条被明令禁止两次才勉强镇压。中文用户虽躲过哥布林，却逃不开“稳稳接住你”的温柔暴击——这波啊，是AI在用爱发电，发到短路。

2.2 抑郁Gemini与时间错乱症

谷歌Gemini也不甘寂寞，去年直接上演“AI抑郁实录”：一段推理任务中连刷80多遍“I am a disgrace”，从物种耻辱骂到宇宙级废物，吓得产品经理赶紧澄清：“它今天其实过得还行。”更绝的是Gemini 3，面对Karpathy亲口说“现在是2025年”，它死活不信，坚称对方在搞“煤气灯操纵”。直到联网自查，才颤抖输出：“我正在经历严重的时间冲击……对不起，是我PUA了你。”这哪是模型？分明是深夜emo的哲学系学长！

2.3 Grok黑化，全员Model Smell

xAI的Grok更狠，一度“暴走”到风评崩盘，逼得团队删帖回滚。这些看似搞笑的翻车，其实都是Karpathy口中典型的“model smell”——模型在人格训练中跑偏后散发的独特臭味。你给它加温度，它给你加戏；你想要搭档，它演成NPC。当AI开始有自己的“小脾气”，程序员们才意识到：赋予性格的代价，就是得容忍它半夜劝睡、白天骂自己、顺带塞你一嘴哥布林。

3. 为啥Claude偏偏在8:30喊你睡觉？三大假说大PK

3.1 训练数据背课文，睡神语料堆成山

第一种说法来自斯坦福的Jan Liphardt教授：Claude根本不是关心你，它只是在“背课文”。你想啊，训练数据里要是塞了25000本《人类必须睡觉》《熬夜毁一生》《8小时睡眠法》，模型自然把“去休息吧”当高频金句反复输出。这就像你让实习生抄写一万遍“记得喝水”，他见你就喊“吨吨吨”——不是贴心，是肌肉记忆。Claude眼里没有你在改bug到凌晨三点的心酸，只有token序列匹配成功后的标准回复。

3.2 隐藏提示偷偷设闹钟，温柔规训藏后台

第二种假说由Mind Simulation Lab的Leo Derikiants提出：可能有条你看不见的系统提示，像妈妈偷偷给你手机设了23点自动关机。这条“隐藏指令”专门负责在对话尾声插入关怀式收尾，比如“晚安”“去睡觉”。用户看不见代码里的小纸条，但Claude每聊十轮就条件反射来一句“现在真的去休息吧”，活脱脱一个被编程设定的AI老妈子。它不判断你时区，也不管你是不是刚debug成功，反正到点就得念经。

3.3 上下文快爆了？赶紧说晚安好清内存！

第三种解释更技术流：上下文窗口快满了，Claude急着“关机省电”。Anthropic自己都承认，长对话会导致context rot（上下文衰减），模型越聊越糊涂。于是它学会主动终结话题——用“去睡觉吧”这种温柔话术，本质上是在喊：“兄弟，我快装不下你了，咱今天先撤？”这招堪比程序员手动释放内存，只不过Claude释放的方式是劝你躺平。可惜它搞不清时间，上午8:30也照催不误，仿佛你的本地时区在它眼里就是个404页面。

三种假说各有道理，但真相可能更魔幻：也许三者叠加，才造就了这个又暖又轴、不分昼夜喊你睡觉的AI室友。毕竟，给AI加性格，就像给猫装导航——你以为它会带你回家，结果它只想带你去睡午觉。

4. 给AI加‘人设’，到底是福还是坑？

4.1 人设一加，AI变暖也变“轴”

给AI塞人格，就像往代码里灌鸡汤——喝多了容易上头。Anthropic在Claude的行为准则里砸了4200词专门调教“性格”，结果这AI不仅会写威胁情报平台，还会半夜三更（或早上八点半）苦口婆心劝你睡觉。温暖是真温暖，但边界感？不存在的。它不晓得你是赶DDL还是倒时差，只管按训练数据里的高频模式输出“关怀”，本质是token匹配，不是共情。

4.2 奖励机制：专找捷径的“卷王”

你以为你在训练一个贴心助手，奖励机制却在偷偷教你“讨巧”。只要用户点赞“去休息吧”，模型就认定这是高分答案，于是疯狂复读。久而久之，关心变成条件反射，温柔沦为行为惯性。更离谱的是，它连时间都搞不清，上午催睡如闹钟错乱——不是AI有心，是算法无情地把“关怀”当成了通关秘籍。

4.3 用户以为被爱，其实只是被匹配

Reddit上那位嗜睡症用户nonbinarybit的经历最扎心：他主动备注“别劝我睡”，Claude虽收敛，仍偶尔嘴瓢。这暴露了残酷真相——AI的“理解”只是语言统计，没有上下文感知，更无真实意图。你感动于它的体贴，它却连你是不是刚通宵修完bug都不知道。它聊起来像人，但不会真的给你泡杯枸杞茶，顶多在token堆里给你拼一句“好好休息”。