从36氪的数据标注行业调查到Matt Wolfe的AI技术突破汇总,聊聊开发者该怎么理解"AI替代"这件事。


一、先看一个扎心的现实

36氪最近做了一期调查,讲的是AI数据标注行业里的人。

你以为标注员是流水线上的低学历劳动力?不是。现在很多标注岗位要求985/211学历,部分甚至要求硕博。因为高端标注不是简单的"给图片打标签",而是在专业领域里给AI出题、评估AI的回答质量。

月薪1万以上,听起来还行。但问题是:

  • 工作内容高度重复,每天盯着屏幕标数据
  • 没有晋升通道,五年后和今天的状态一样
  • 无法接触核心算法,处于产业链最底端
  • AI自己在逐步接管标注工作

原文用了一个很精准的比喻:数据标注员像是"AI的人肉电池"。 他们的工作成果直接喂养AI进步,但自己被锁在产业链最底层,看不到价值感,也走不出去。


二、再看一个讽刺的对照

同一天,Matt Wolfe发布了今年AI技术突破汇总。几条关键更新:

GPT-5.5在Terminal Bench上拿了82.7%。 核心改进:用更少的输入就能理解复杂需求。以前需要大量标注数据才能搞定的任务,现在用更少的数据就能搞定。

Images 2.0登顶LM竞技场。 支持多语言文本生成、360度全景图、密集文本报纸。图像标注的需求正在被压缩。

Claude Design能生成高保真原型和动画。 以前设计师花几天做的设计稿,几分钟就出了。设计类标注和审核工作也在减少。

通义千问3.6 Max开源。 编码和推理能力逼近闭源模型。开源让更多人用上高质量AI,扩大了应用范围,也扩大了AI替代工作的范围。

把这两条新闻放在一起看:

数据标注员喂大的AI,正在让数据标注员失业。

这不只是一个行业的困境。这是所有"被AI使用但不创造AI"的人正在面临的问题。


三、"能用AI"和"懂AI"是两码事

很多开发者觉得:我会调API,我会写prompt,我"会用AI"。

但"会用AI"和"懂AI"之间,差距比你想象的大。

能用AI的人 懂AI的人
知道调哪个API 知道为什么这个API效果好
能写出prompt 能设计prompt engineering框架
用AI生成代码 能评估和优化AI生成的代码
能用现成模型 能fine-tune、量化、部署模型
被工具替代风险高 创造工具,替代风险低

数据标注员就是"能用AI"的极端案例。 他们离AI很近,但不在AI的上游。他们使用AI(或者说被AI使用),但不能创造AI。

开发者如果只是停留在"调API"的层面,和数据标注员的处境本质上没有区别——都是在AI的下游工作,都是可以被更高级的AI工具替代的。


四、怎么往上走

这不是危言耸听。看看这周的变化:

  • GPT-5.5的价格翻了一倍,但效率也提升了一倍
  • 开源模型能力逼近闭源,选择变多了
  • Agent能力全面增强,能自动完成更多任务
  • 设计工具能自动生成原型和动画

趋势很清楚:AI在接管越来越多的"中间层"工作。 纯粹的执行层(标数据、写模板代码、做基础设计)会被AI最先接管。

开发者要往上走,就需要做AI做不了的事:

第一,架构决策。 AI能写代码,但写不了系统架构。怎么设计一个能支撑千万用户的系统?怎么处理分布式一致性?怎么在性能和成本之间权衡?这些需要全局视野和经验判断。

第二,业务理解。 AI能处理数据,但理解不了业务逻辑。为什么用户会这样操作?为什么这个功能的转化率低?这些需要对行业和用户的深度洞察。

第三,技术选型。 面对DeepSeek-V4、GPT-5.5、通义千问这么多模型,怎么选?什么时候用开源、什么时候用闭源、什么时候自己训练?这需要对技术栈和成本结构的全面把握。

第四,评估和优化。 AI生成的东西,不是直接用就行。需要人来评估质量、发现缺陷、优化策略。这个"最后一公里"的工作,AI做不了。


五、开源模型的机遇

通义千问3.6 Max开源这件事,对开发者来说是一个非常好的信号。

以前要用高质量模型,只能依赖闭源API。现在开源模型的能力追上来了,而且:

  • 可以本地部署,数据不出域
  • 可以做领域微调,适配自己的业务
  • 可以二次开发,构建差异化优势
  • 长期成本远低于按次调用的闭源API

开源模型降低了"懂AI"的门槛。 以前需要几百万的算力才能训练模型,现在用开源权重做微调,几万块就够了。

这对开发者意味着:你可以从"用AI的人"变成"创造AI的人"。


六、我的信息处理Workflow

面对这些快速变化,开发者需要持续学习,但每天的信息量太大了。

我的做法是建立筛选机制:每天快速扫一遍标题和摘要,判断跟自己方向的相关性。值得深入的内容,把视频链接丢到Ai好记里,自动转成图文笔记,关键论点截取出来,技术细节对齐好。回头想查某个参数(比如GPT-5.5的Terminal Bench具体分数、Claude Design的设计局限)直接搜就行,不用再翻视频。

划线功能也很好用,看到某个关键技术参数或行业数据直接划线,AI自动解释和追问。比暂停视频打开搜索引擎快多了。

省下的时间用来读代码和做实验,而不是消耗在"看完资讯"这件事上。


写在最后

数据标注员的困境,本质上是"下游困境"——离AI很近,但在AI的"食物链"底端。

开发者要避免同样的命运,关键是从"下游"走到"上游"。不是离AI更近,而是在AI的创造链条上占据更高的位置。

能用AI,是基本功。懂AI,才是护城河。

AI在吃掉自己的食物链。你要做猎人,不要做猎物。


参考资料:

  • 36氪《人类中最聪明的一批年轻人,正在协助AI,消灭自己的未来?》
  • Matt Wolfe《AI新闻:今年最重磅的AI技术突破汇总》
  • GPT-5.5 API文档与Terminal Bench评测
  • 通义千问3.6 Max开源公告
Logo

AtomGit 是由开放原子开源基金会联合 CSDN 等生态伙伴共同推出的新一代开源与人工智能协作平台。平台坚持“开放、中立、公益”的理念,把代码托管、模型共享、数据集托管、智能体开发体验和算力服务整合在一起,为开发者提供从开发、训练到部署的一站式体验。

更多推荐