大家好,我是羊仔。

 

最近真是热闹得不行,各种顶级大模型你方唱罢我登场,更新速度快得让羊仔都快跟不上了。

昨天OpenAI又甩出了GPT-5.2,号称「迄今为止在专业知识工作上最强大的模型」!

今天,羊仔就来和大家聊聊,GPT-5.2,到底强在哪,又是如何直接颠覆程序员的工作流的!

图片

一、这个就叫专业

首先让羊仔眼前一亮的,就是GPT-5.2在「专业知识工作」上的表现。

OpenAI这次特别强调,GPT-5.2是为专业人士打造的,能帮助大家节省大量时间。

GDPval评估指标,专门衡量模型在44个职业中的知识工作任务表现。

图片

GPT-5.2 Thinking在GDPval上竟然达到了70.9%的水平,这意味着它在70%以上的情况下,能和行业顶尖专家打平甚至超越!

想象一下,你只需要给它一个需求,它就能帮你生成一份专业级的销售演示文稿、会计报表、急诊排班表,而且直接可用。

二、编程暴涨80%?程序员危!

对于羊仔这种经常和代码打交道的人来说,GPT-5.2的编码能力简直是bug级别的提升!

图片

GPT-5.2 Thinking在SWE-bench Verified上直接飙到了80%!

而更难的SWE-Bench Pro,涵盖四种编程语言,更接近真实工程场景,也达到了55.6%,超过了包括Gemini 3 Pro和Claude Opus 4.5在内的所有对手。

现在GPT-5.2能更可靠地调试生产代码、实现功能请求、重构大型代码库,甚至还能搞定前端开发和复杂的3D UI设计。

而且,OpenAI还说几周内会发布专门针对编程优化的GPT-5.2-Codex版本。

羊仔已经迫不及待了,感觉那会是真正的编程专家!同时,羊仔也在想,这下程序员的失业时间是不是又得提前了。

想象一下,你花一个月时间写出来的算法,AI只要半个小时就能完成,而且算法效率还比你更优化。。。

三、超长记忆力,256K上下文

羊仔还记得之前处理几十页报告的噩梦,那时最头疼的就是信息量太大,模型处理不了那么长的文本,常常读到后面就忘了前面。

GPT-5.2的超长记忆力彻底解决了这个问题!

图片

它在长上下文推理方面达到了新的SOTA(State Of The Art),在OpenAI MRCRv2评估中,竟然能在256K tokens,相当于几十万字的超长文本中,保持几乎100%的准确率!

这意味着你可以把几十万字的报告、合同、科研论文、访谈记录,甚至多文件项目一股脑地扔给它,它都能帮你准确地理解、分析和总结,而且不会前言不搭后语。

非常适合深度文档分析、综合推理和复杂多来源数据,再也不用担心模型失忆了!

四、视觉突破,看」懂你的世界!

视觉能力也是GPT-5.2的一大亮点。

羊仔以前觉得AI在理解图像方面,总是差那么点意思,尤其是复杂的图表和用户界面,但GPT-5.2 Thinking的火眼金睛让羊仔大为惊叹!

图片

它在图表推理和软件界面理解方面的错误率几乎降低了一半!也就是说它能更准确地解读仪表盘、产品截图、技术图表和视觉报告。

羊仔在做PPT的时候,经常需要从各种报告里截取图表,然后手动分析数据、总结趋势。

现在,GPT-5.2可以直接看懂这些图表,甚至能帮你分析出图表背后的含义。

OpenAI还展示了一个例子,让GPT-5.2识别主板上的组件,即使是低质量的图片,它也能准确识别并标注出主要区域。

图片

这让羊仔不禁思考,未来我们是不是可以直接把一张产品设计图扔给AI,让它自动生成代码,做出产品?

这简直是设计师、工程师和产品经理的完全体!

五、工具调用,AI承包了

在羊仔看来,AI模型的工具调用能力,是它真正走向智能体,融入我们工作流的关键。

GPT-5.2在这方面也取得了突破,在Tau2-bench Telecom上达到了98.7%的SOTA成绩,这意味着它能更可靠地在长链路、多轮任务中使用工具。

图片

举一个非常生动的例子:一个旅客航班延误、错过转机、行李丢失、需要过夜,还有医疗座位需求。

GPT-5.2能管理整个任务链,包括重新预订、特殊协助座位和赔偿,提供比GPT-5.1更完整的解决方案。

六、数学,科研,让不可能变可能!

最后,不得不提的是GPT-5.2在科学和数学领域的惊人表现。

羊仔一直坚信AI能加速科学研究,造福全人类,这次GPT-5.2的表现,让羊仔对这个愿景更加充满信心!

图片

它在研究生级别的GPQA Diamond问答基准上,GPT-5.2 Pro达到了93.2%,GPT-5.2 Thinking也达到了92.4%。

更厉害的是,在AIME 2025(一个数学竞赛)上,GPT-5.2竟然拿到了100分!满分啊!

这AI的数学能力,已经超越了绝大多数人类了吧?

未来会有多少不可能变成可能,真是想想都让人兴奋!

七、版本选择困难症,我该选哪个?

这次GPT-5.2分成了三个版本:Instant、Thinking、Pro,这不免让人犯了选择困难症。

GPT-5.2 Instant

快速响应,适合日常工作和学习,比如信息查询、操作指南、技术写作和翻译。

它延续了GPT-5.1 Instant的温暖对话风格,解释更清晰,能把关键信息提前呈现。

羊仔觉得,这个版本用来快速查资料、写个邮件草稿,肯定很给力。

GPT-5.2 Thinking

这是为深度工作设计的思考模型,处理复杂任务能力更强,尤其是在代码编写、长文档总结、文件问答、数学逻辑推理和决策支持方面。

羊仔上面提到的那些惊艳功能,大部分都集中在这个版本。

对于需要处理复杂项目的人来说,Thinking版本无疑是首选。

GPT-5.2 Pro

OpenAI最聪明、最值得信赖的模型,专门处理最困难的问题,提供最高质量的答案。

当然,可能需要等待更长时间,对于那些对答案质量有极高要求,或者在科研等复杂领域需要最强助力的用户,Pro版本绝对是终极选择。

羊仔觉得,OpenAI这样细分版本,是为了满足不同用户的需求,大家可以根据自己的日常工作和预算,选择最适合自己的版本。

八、价格与未来:贵了,但更值了!

当然,这么强大的模型,价格自然也水涨船高。

GPT-5.2的API价格有所上涨,输入费用为每百万tokens 1.75美元,输出费用为每百万tokens 14美元。

相比GPT-5.1,确实贵了一些。

图片

但羊仔觉得,虽然单个token成本更高,但由于GPT-5.2的token效率更高,完成同等质量的任务,总成本反而可能更低。

就像买工具,虽然好工具贵,但能大大提升你的工作效率和产出质量,从长远来看,是更划算的投资。

目前OpenAI没有计划在API中弃用GPT-5.1、GPT-5或GPT-4.1,这给了开发者们充足的缓冲时间。

而且,未来几周还会发布针对Codex优化的GPT-5.2版本,这让羊仔对未来的AI编程工具充满了期待!

九、羊仔说

GPT-5.2在专业工作、编码、长上下文理解、视觉和工具调用等方面的巨大进步,让羊仔看到了AI真正融入我们日常工作和生活的无限可能。

OpenAI的创始人山姆·奥特曼在公司十周年之际说:“我们相信,再过十年,我们几乎肯定能够打造出超级智能。”

羊仔觉得,这个超级智能的时代,可能比我们想象的来得更快。

所以,各位小伙伴,真的准备好了吗?

好了,今天的分享就到这里,如果你对GPT-5.2有什么看法,欢迎在评论区留言!

共勉!

欢迎关注羊仔,一起探索AI,成为超级个体!

如果你喜欢这篇文章,不妨点赞,在看,转发。

你的每一次互动,对羊仔来说都是莫大的鼓励。

Logo

AtomGit 是由开放原子开源基金会联合 CSDN 等生态伙伴共同推出的新一代开源与人工智能协作平台。平台坚持“开放、中立、公益”的理念,把代码托管、模型共享、数据集托管、智能体开发体验和算力服务整合在一起,为开发者提供从开发、训练到部署的一站式体验。

更多推荐