炸裂！Subquadratic 一家创业公司声称打破了 Transformer 七年魔咒

吴佳浩 Alben

297人浏览 · 2026-05-22 10:12:07

吴佳浩 Alben · 2026-05-22 10:12:07 发布

在这里插入图片描述

炸裂！Subquadratic 一家创业公司声称打破了 Transformer 七年魔咒

AI 深度观察

12M token 上下文 · 算力降低 1000 倍 · 融资 2900 万美元
这是真正的架构革命，还是又一次 AI 营销泡沫？

两周前，一家叫 Subquadratic 的迈阿密初创公司从隐身模式中杀出，宣称打破了自 2017 年以来定义所有主流 AI 系统的数学约束。它的模型 SubQ，发布 24 小时内获得超过 1200 万次曝光，3 万人涌入候补名单。AI 圈炸了。

先搞懂问题本身

要理解 SubQ 为什么让人兴奋，先要理解 Transformer 架构的根本瓶颈。

正是因为 O(n²)，Claude、GPT、Gemini 的上下文越长越贵，越慢，也越容易出现"中间注意力退化"——模型装了一仓库书，却未必真的全记住了。

于是整个行业催生出 RAG（检索增强）、向量数据库、Context Compression、Memory System 这一套复杂体系，本质上是在用工程 patch 绕过架构瓶颈。

SubQ 的核心主张

该公司将其架构称为 SSA（Subquadratic Selective Attention，次二阶选择注意力）。它不是让每个 token 看所有 token，而是只关注"重要的 token"——类似稀疏图上的动态路由，理论上将计算复杂度从平方降至线性。

官方数据：在 1M token 下，SSA 比 FlashAttention 快 52 倍；研究版 12M token 时，相比主流前沿模型算力减少接近 1000 倍。产品线包括面向开发者的全上下文 API、代码 Agent SubQ Code，以及长文档搜索工具 SubQ Search，目前均为私测阶段。

投资人阵容包括 Tinder 联合创始人 Justin Mateen、前软银愿景基金合伙人 Javier Villamizar，以及 Anthropic、OpenAI、Stripe、Brex 的早期投资人。

为什么 Agent 圈子最激动

现在 AI Agent 最大的瓶颈，说实话不是"智商"，而是上下文。做代码 Agent 的（Cursor、Claude Code、Codex），都在疯狂做 RAG、Chunk、Summary，本质原因就一个：整个工程仓库根本塞不进去。

SubQ 说：老子直接全塞进去

整个代码仓库、全部合同、所有日志、完整交互历史——一次性进 Context。官方甚至直接宣称"RAG 是 Transformer 时代的 workaround"。这句话如果成立，冲击的可不只是模型本身，而是整个 AI 基础设施栈：向量数据库、检索系统、记忆压缩、Context Engineering 工具链——都可能面临重构。

更关键的是，SubQ 主打的不只是"能放进去"，而是"放进去还真能理解"。很多号称 1M 上下文的模型存在"Lost in the Middle"问题——表面上支持长上下文，实际注意力早已稀释。SubQ 在 RULER 128K 基准测试上报告了 95% 的精确度，Needle-in-Haystack 和精确复制任务表现也颇为亮眼。