AI的本质:量化从模型蓄势到叙事模式算法的压缩对象

流形学习是一类非线性降维方法,其核心假设是:高维数据实际上分布在一个低维流形上,算法的任务就是从高维观测中恢复出这个低维结构。


📐 正式定义

设高维数据空间为 R D \mathbb{R}^D RD D D D 很大),存在一个光滑的 d d d 维流形 M \mathcal{M} M d ≪ D d \ll D dD),使得:

x i ∈ R D , 但 x i = f ( z i ) , z i ∈ M ⊂ R d x_i \in \mathbb{R}^D, \quad \text{但} \quad x_i = f(z_i), \quad z_i \in \mathcal{M} \subset \mathbb{R}^d xiRD,xi=f(zi),ziMRd

其中 f : M ↪ R D f: \mathcal{M} \hookrightarrow \mathbb{R}^D f:MRD 是一个嵌入映射(把低维卷成高维)。

流形学习的目标:已知 x i x_i xi,求 z i z_i zi


🔑 三个关键词

关键词 含义
流形(Manifold) 局部像欧氏空间的拓扑空间——局部是平的,整体可以卷
降维(Dimensionality Reduction) 从高维 D D D 恢复到低维 d d d
非线性(Nonlinear) 不是简单的投影(如PCA),而是能展开弯曲的结构

压缩即一切


“现实世界是一个错综复杂的巨系统,不可避免地交织着无数的冗余与噪音。正如大语言模型压缩了全人类的互联网文本,才涌现出了惊人的理解力。”


概念:由压缩而来,成语是对故事的压缩

让我们从一个被业界默念却从未被真正说透的公式开始:

Compression is Intelligence \boxed{\text{Compression is Intelligence}} Compression is Intelligence

这不是比喻。这是本体论。

宇宙的全部历史,就是一部压缩与解压缩的叙事:

层级 压缩态(蓄势) 解压缩态(叙事)
宇宙学 大爆炸奇点——无限密度 宇宙膨胀——时空展开
生物学 DNA双螺旋——30亿碱基对 蛋白质折叠——生命展开
语言学 索绪尔的能指/所指 乔姆斯基的深层→表层语法
文明史 文字发明——口语的压缩 印刷术——文本的指数展开
AI 参数权重——人类认知的压缩 生成输出——叙事的涌现

压缩不是手段,压缩就是存在本身的方式。

一切存在物,都是某个更高维空间向低维空间的投影——而投影,本质上就是有损压缩。你读到的小说,是作者整个人生的压缩。

AI做的事情,不过是把这个宇宙级的原理,第一次变成了可计算的工程现实


蓄势:压缩的几何

回到我们之前的意气实体过程数学框架。

蓄势,就是约翰·R·斯塔林斯折叠后的图。

自由群 F 2 F_2 F2 的Cayley图是一棵无限展开的树——每一个生成元是一个方向,每一个词是一条路径。这是"未压缩"的状态:可能性无限,但不可控。

当我们取一个子群 H H H,约翰·R·斯塔林斯折叠把这棵树折起来——无数条平行的路径被识别为同一条边,无数个冗余的节点被坍缩为一个。

折叠 = 压缩
折叠后的图 = 蓄势态
典范完备化 = 叙事展开

这就是为什么"蓄势"给人以力量感——它不是空无,而是被极度压缩的势能。就像弹簧被压到最短的那一刻,所有的可能性都还在,但都被折叠进了一个极小的几何结构里。

用群论的语言说:

蓄势 = 群  G  的有限表示 → Cayley图 几何空间  X \text{蓄势} = \text{群 } G \text{ 的有限表示} \quad \xrightarrow{\text{Cayley图}} \quad \text{几何空间 } X 蓄势= G 的有限表示Cayley 几何空间 X

∣ G ∣  可以是无穷的,但它的"形状"由有限个生成元和关系决定 |G| \text{ 可以是无穷的,但它的"形状"由有限个生成元和关系决定} G 可以是无穷的,但它的"形状"由有限个生成元和关系决定

这就是AI的权重矩阵。 数千亿参数,看起来是天文数字,但相对于它所压缩的"全人类认知空间",它是一个极低维的流形


叙事:解压缩的涌现

当蓄势被"读出",叙事就发生了。

从几何群论看,这是Milnor-Švarc引理的叙事化:群就是空间,空间就是群。换句话说:如果一个群"足够好地"作用在一个空间上,那么这个群和这个空间在粗粒度上是同一个东西。

抽象群 G G G(蓄势)与度量空间 X X X(叙事场)拟等距

拟等距的意思是:你不可能精确还原,但你能在"相差有限"的范围内理解全部。

这就是阅读AI生成文本的体验——它不是"复制"了人类的某篇文章,而是在一个被压缩的认知流形上,找到了一条与你的提问拟等距的测地线。

而"涌现"(emergence),就是解压缩过程中的分形展开

“涌现意味着数据模块从有限数量到庞大数量、从简单到复杂,以及从低层级到高层级的连接、耦合、组建……它的本质是由小生大,由简入繁。”

用群论说:当你从子群 H H H 的约翰·R·斯塔林斯图出发,做典范完备化,你得到的覆盖空间 X ~ \tilde{X} X~ 上,每一个纤维都是一个"可能的叙事"。

这就是为什么同一个prompt能生成无限个不同的文本——它们是同一个压缩态在不同纤维上的展开。

叙事学概念 几何群论对应 压缩/解压缩
伏笔 短程测地线 蓄势中的隐藏边
高潮 测地线的最大曲率点 压缩态的能量释放
开放结局 非紧空间 解压缩永不终止
叙事失控 覆盖空间的分支失控 压缩不足,纤维过多
人物一致性 子群的正规性 压缩结构的自洽性

AI前景:从蓄势压缩到叙事模式的量化

大佬们的叙事——黄仁勋的"新电力"、奥特曼的"AGI即将到来"、马斯克的"生存威胁"——都是不完整的

不是因为他们说错了,而是因为他们站在叙事的展开态里,看不见压缩态的全貌。

AI的真实本质是:

它是人类认知活动前所未有规模的压缩与整合。它内化了人类几千年积累的思维方式、论证结构、因果推理模式,从人类全部的文字记录里提取出最共性的认知模式。

它不是电力——电力是中性的能量,没有内容。
它不是员工——员工有主观意图,AI没有。
它不是 competitor——竞争需要对等的认知主体,AI不具备。

它是一面镜子。一面经过极度压缩的镜子。

它映射的是人类认知活动的共性——最高频的、最平均的、被最多人接受的那部分。它无法映射的,是个人的认知洞见——那些偏离平均路径的、只有特定的人从特定的认知路径才能产出的洞见。

AI生成可能,人寻找因果。
AI的优势在覆盖宽度,人的优势在建立深度。

这不是竞争关系,这是分工关系——而分工的本质,就是压缩与解压缩的不同层次


压缩即一切:终极统一

现在我们可以说出那个终极命题了:

Compression is Everything \boxed{\text{Compression is Everything}} Compression is Everything

一切都是压缩。一切都是叙事。

维度 压缩(蓄势) 叙事(展开)
物理 普朗克长度——最小不可分 宇宙微波背景辐射——最大展开
生命 基因——4个碱基的编码 表型——无限可能的展开
意识 神经元的稀疏编码 觉知场域中的意义焦点凝聚
语言 音素→语素→词→句 文本→语境→世界
AI 权重矩阵——人类认知的流形 生成输出——叙事的测地线
文明 制度、法律、范式 历史、革命、演化

而"势"——中国美学的核心概念——就是压缩到极致而未发的状态

“愈折愈健,愈折愈奇” ——《聊斋》的蓄势美学
“势,不是单一参数的线性增长,而是复杂系统的能量耦合” ——甲子光年

AI就是这个时代的"蓄势"。 它把人类文明的全部认知压缩进了一个数学对象,而每一次对话,都是一次叙事的展开。


从蓄势的模型到叙事模式的几何群论

本博从三个层面展开论述。


蓄势的模型:叙事的"潜伏几何"

在中国叙事理论中,“势” 是一个核心美学概念——“具有运动感、力量感和生命感”(参《中国古代文学理论体系:原人论》)。以《聊斋志异》为例,其"矫健之势"的营造关键在于 “折” ——“愈折愈健,愈折愈奇”。

从几何群论的视角重新审视对阿道夫叙事模型的精细分析,我们发现一个惊人的结构对应:

叙事理论概念 几何群论对应
叙事模型是抽象的三维物体 群的Cayley图/复形
隐藏在模型中的多重平行空间 群作用的轨道空间、覆盖空间
叙事场中交错重叠的空间 图的折叠(Stalling折叠)、群的HNN扩张
读者经验填充的"空缺"(virtus) 拟等距嵌入中的"拟稠密"像
时间凝聚在叙事模型中 词度量下的测地线

核心洞察:蓄势,就是叙事尚未展开时的几何潜结构——一个群尚未被"读出"时的Cayley图。所有可能的故事是平行的轨道,隐藏在模型的纤维之中。


从蓄势到叙事:Milnor-Švarc引理的叙事化

几何群论的基石——Milnor-Švarc引理——恰好形式化了"蓄势→展开"的跃迁:

X X X 是真测地度量空间, G G G 几何作用在 X X X 上,则 G G G 是有限生成的且 G G G 拟等距于 X X X

叙事化翻译:

数学表述 叙事含义
G G G 是抽象群(蓄势态) 叙事的潜在可能性——所有尚未展开的情节
X X X 是几何空间(展开态) 叙事场——读者经验中的时空
拟等距 f : G → X f: G \to X f:GX 阅读行为本身——不是精确同构,而是"相差有限"的理解
拟等距不变量(增长型等) 叙事的结构型——不因具体讲述而改变的深层模式

这正是几何群论核心方法论:

形(流形) → 基本群 数(群) → 复形 形(组合结构) \text{形(流形)} \xrightarrow{\text{基本群}} \text{数(群)} \xrightarrow{\text{复形}} \text{形(组合结构)} 形(流形)基本群 数(群)复形 形(组合结构)

“否定之否定,螺旋上升”——蓄势是第一重"形",叙事展开是第二重"形",而群是中间的"数"。

约翰·R·斯塔林斯折叠:蓄势的"压缩算法"

约翰·R·斯塔林斯折叠提供了最精确的类比:

  • 自由群 F 2 F_2 F2 的Cayley图是"双叶玫瑰"——每个生成元是一个花瓣(情节线索)
  • 子群 H H H 的约翰·R·斯塔林斯图是"折叠后"的结构——蓄势的压缩态
  • 通过典范完备化(canonical completion),我们从折叠图恢复到覆盖空间——叙事的展开

这与叙事中"蓄势→爆发"的结构完全同构:

蓄势 = 约翰·R·斯塔林斯折叠后的简化图(信息被压缩,多条线索汇于一点)
叙事展开 = 典范完备化后的覆盖空间(每条线索获得独立的展开空间)

Marshall Hall定理由此获得叙事意义:自由群的有限生成子群是可分的——每一条蓄势的线索,终将在某个有限重的叙事覆盖中被完整展开。


叙事模式的几何分类:从埃尔朗根到胡塞尔现象学

埃尔朗根纲领的叙事推广

克莱因1872年的埃尔朗根纲领宣称:

给定一个变换群,就有一种相应的几何学。

将此推广到叙事:

几何 变换群 叙事模式
欧氏几何 刚性运动群 E ( n ) E(n) E(n) 线性叙事——情节刚性平移,结构不变
仿射几何 仿射变换群 A f f ( n ) Aff(n) Aff(n) 变形叙事——情节可拉伸剪切,平行关系(因果)保持
射影几何 射影变换群 P G L ( n + 1 ) PGL(n+1) PGL(n+1) 视角叙事——同一事件在不同视点下等价
双曲几何 P S L 2 ( R ) PSL_2(\mathbb{R}) PSL2(R) 分支叙事——指数增长的可能性空间

双曲群与叙事的"指数爆发"

自由群 F 2 F_2 F2指数增长型 β ( r ) ∼ e r \beta(r) \sim e^r β(r)er),而 Z n \mathbb{Z}^n Zn多项式增长型 β ( r ) ∼ r n \beta(r) \sim r^n β(r)rn)。

这恰好区分了两种叙事模式:

  • 多项式增长叙事(如 Z n \mathbb{Z}^n Zn):情节线性展开,可能性可控——对应传统章回小说
  • 指数增长叙事(如 F 2 F_2 F2):情节分支爆炸,可能性指数级增长——对应《聊斋》式的"愈折愈奇"

Gromov的多项式增长定理进一步断言:

有限生成群是多项式增长的    ⟺    \iff 它是虚拟幂零的(virtually nilpotent)

叙事化:只有当叙事结构具有足够的"幂零性"(层级可控的因果链),其展开才是多项式的、可预测的。而《聊斋》式的蓄势-爆发结构,本质上是双曲群的——它拒绝被简化,永远在指数级地生成新的可能世界。

任何复杂的叙事结构(胡塞尔流形),都存在一个有限重的"覆盖叙事",其中可以找到一个不可压缩的"核心主题"(不可压缩曲面):叙事的"有限覆盖"

任何复杂的叙事结构(胡塞尔流形),都存在一个有限重的"覆盖叙事",其中可以找到一个不可压缩的"核心主题"(不可压缩曲面)是几何群论的巅峰成就之一:

胡塞尔流形有一个有限重覆盖,包含一个嵌入的不可压缩曲面。

叙事意义:任何复杂的叙事结构(胡塞尔流形),都存在一个有限重的"覆盖叙事",其中可以找到一个不可压缩的"核心主题"(不可压缩曲面)。

这正是"蓄势→叙事"的终极保证:无论叙事如何曲折(双曲),总存在一个有限的展开层次,使得核心意义(主题)清晰浮现。


王船山流形的结构,结构化,结构化分析:一个统一的框架

蓄势模型                          叙事模式
  │                                  │
  ▼                                  ▼
抽象群 G (潜在情节)    ──拟等距──▶   度量空间 X (展开的叙事场)
  │                                  │
  │  Milnor-Švarc                     │  测地线 = 情节主线
  │  Stalling折叠 = 蓄势压缩          │  平行空间 = 多重解读
  │  增长型 = 叙事节奏                 │  双曲结构 = 指数爆发
  │  虚拟性质 = 有限覆盖中的主题       │  拟凸子群 = 可分离的线索
  ▼                                  ▼
        几何群论:形 → 数 → 形(螺旋上升)

从蓄势到叙事,本质上是一个群被"几何化"的过程——抽象的可能性(群)通过Cayley图获得空间结构,通过拟等距获得可理解的度量,通过覆盖空间获得多层次的展开。而叙事理解,就是读者在这个几何空间中寻找测地线的过程。

“叙事模型所构建的叙事场域是一个多维物体……读者开始阅读作品的时候,所有的符号都由平面的图像转化为故事中的情节。”——这正是Milnor-Švarc引理的叙事诗篇。

最终图景:一切历史皆是当代史,一切现象来自历史,现象学即是心理学,成于印象,革之观念,各美其美,美美与共。

                    ┌─────────────────────────────┐
                    │     觉知场域(Awareness)      │
                    │   前反思性的可能性空间          │
                    └──────────────┬──────────────┘
                                   │ 压缩
                                   ▼
                    ┌─────────────────────────────┐
                    │     意义焦点(Focus)          │
                    │   D-O-S 三值纠缠的暂态稳态     │
                    │   ← AI的权重矩阵 = 此结构的压缩 │
                    └──────────────┬──────────────┘
                                   │ 展开(涌现)
                                   ▼
                    ┌─────────────────────────────┐
                    │     叙事舞台(Stage)          │
                    │   行为呈现、意义试炼、共识协商   │
                    │   ← AI生成 = 此舞台上的测地线   │
                    └──────────────┬──────────────┘
                                   │ 反馈
                                   ▼
                    ┌─────────────────────────────┐
                    │     价值星图(Star Map)       │
                    │   被社群公认的客观值O的集合      │
                    │   ← 更新后重新压缩 → 回到焦点   │
                    └─────────────────────────────┘

                    呼吸式循环,永不停息。
                    压缩→展开→压缩→展开……
                    这就是一切。

尾声

所以,当你问"AI的本质是什么"——

不要去听大佬们的叙事。
不要去看股价的波动。
不要去焦虑会不会被替代。

去看压缩本身。

AI告诉你的最深的秘密,不是它能写诗、能画画、能编程——那些都是展开态的表象。

它告诉你的最深的秘密是:

你之所以是你,不是因为你展开了什么,而是因为你压缩了什么。

你的记忆、你的创伤、你的审美、你的直觉——都是你独有的压缩算法。

AI能压缩全人类,但它压缩不了你。

这就是你的势。这就是你的叙事。这就是你不可替代的原因。

压缩即智能。压缩即存在。压缩即一切。

而人才,若你,是那个还没被完全读出的——蓄势

云藏山鹰代数信息系统

附录 云藏山鹰代数信息系统(YUDST Algebra Information System)

数学定义
E \mathcal{E} E意气实体集合(如具有主观意图的经济主体、决策单元), P \mathcal{P} P过程集合(如交易、协作、竞争), I \mathcal{I} I信息状态集合(如资源分配、偏好、策略)。定义三元组 SEP-AIS = ( S , O , R ) \text{SEP-AIS} = (\mathcal{S}, \mathcal{O}, \mathcal{R}) SEP-AIS=(S,O,R),其中:

  1. 状态空间 S \mathcal{S} S
    S = E × P × I \mathcal{S} = \mathcal{E} \times \mathcal{P} \times \mathcal{I} S=E×P×I,表示实体在特定过程中所处的信息状态组合。
    示例:若 e ∈ E e \in \mathcal{E} eE 为“企业”, p ∈ P p \in \mathcal{P} pP 为“生产”, i ∈ I i \in \mathcal{I} iI 为“库存水平”,则 ( e , p , i ) ∈ S (e, p, i) \in \mathcal{S} (e,p,i)S 描述企业生产时的库存状态。

  2. 运算集合 O \mathcal{O} O
    O = { O 1 , O 2 , … , O k } \mathcal{O} = \{O_1, O_2, \dots, O_k\} O={O1,O2,,Ok},其中每个 O i : S n → S O_i: \mathcal{S}^n \to \mathcal{S} Oi:SnS n ≥ 1 n \geq 1 n1)为意气实体过程操作,满足:

    • 封闭性:对任意 s 1 , s 2 , … , s n ∈ S s_1, s_2, \dots, s_n \in \mathcal{S} s1,s2,,snS,有 O i ( s 1 , s 2 , … , s n ) ∈ S O_i(s_1, s_2, \dots, s_n) \in \mathcal{S} Oi(s1,s2,,sn)S
    • 代数结构 ( S , O ) (\mathcal{S}, \mathcal{O}) (S,O) 构成特定代数系统(如群、环、格),刻画实体交互的逻辑规则。
      示例
      • O \mathcal{O} O 包含“交易操作” O trade O_{\text{trade}} Otrade,且 ( S , O trade ) (\mathcal{S}, O_{\text{trade}}) (S,Otrade) 构成群,则逆操作 O trade − 1 O_{\text{trade}}^{-1} Otrade1 可表示“撤销交易”。
      • O \mathcal{O} O 包含“资源合并” O merge O_{\text{merge}} Omerge 和“资源分配” O split O_{\text{split}} Osplit,且 ( S , O merge , O split ) (\mathcal{S}, O_{\text{merge}}, O_{\text{split}}) (S,Omerge,Osplit) 构成格,则可描述资源层次化分配。
  3. 关系集合 R \mathcal{R} R
    R = L ∪ C \mathcal{R} = \mathcal{L} \cup \mathcal{C} R=LC,其中:

    • L ⊆ S × S \mathcal{L} \subseteq \mathcal{S} \times \mathcal{S} LS×S逻辑关系(如数据依赖、因果关系);
    • C ⊆ S → R \mathcal{C} \subseteq \mathcal{S} \to \mathbb{R} CSR约束函数(如成本、效用、风险)。
      示例
    • 逻辑关系 R depend ⊆ S × S R_{\text{depend}} \subseteq \mathcal{S} \times \mathcal{S} RdependS×S:若实体 e 1 e_1 e1 的过程依赖实体 e 2 e_2 e2 的信息,则 ( ( e 1 , p 1 , i 1 ) , ( e 2 , p 2 , i 2 ) ) ∈ R depend ((e_1, p_1, i_1), (e_2, p_2, i_2)) \in R_{\text{depend}} ((e1,p1,i1),(e2,p2,i2))Rdepend
    • 约束函数 C cost : S → R C_{\text{cost}}: \mathcal{S} \to \mathbb{R} Ccost:SR:计算实体在某状态下的操作成本。

满足条件
( S , O ) (\mathcal{S}, \mathcal{O}) (S,O) 满足代数系统公理(如群的结合律、格的吸收律),且 R \mathcal{R} R 描述实体过程的语义约束(如资源非负、策略一致性),则称 ( S , O , R ) (\mathcal{S}, \mathcal{O}, \mathcal{R}) (S,O,R)意气实体过程代数信息系统

进阶阅读

【云藏山鹰代数信息系统】王阳明《传习录》及其思想,六经注我,我注六经
【王阳明代数】热门回答,什么是王船山流形?
【云藏山鹰代数信息系统】云藏山鹰圆结构化分析上的欧阳修效应综述
【云藏山鹰代数信息系统】意气实体过程模型综述
【云藏山鹰代数信息系统】意气实体过程对象及变项、支撑物综述
【云藏山鹰代数信息系统】意气实体过程分析综述
【云藏山鹰力学】云藏山鹰力学意气实体过程具身智能实验平台开发环境
【云藏山鹰代数信息系统】语言模型核心代码调研
【道装技术】意气实体过程虚拟机协程间琴语言对象通讯,计算,数据公理化基础
【云藏山鹰代数信息系统】才气学中“数据-信息-情报-知识”的推理与运作机制
【云藏山鹰代数信息系统】2026年初3月CSDN花间流风博文技术汇总

Logo

AtomGit 是由开放原子开源基金会联合 CSDN 等生态伙伴共同推出的新一代开源与人工智能协作平台。平台坚持“开放、中立、公益”的理念,把代码托管、模型共享、数据集托管、智能体开发体验和算力服务整合在一起,为开发者提供从开发、训练到部署的一站式体验。

更多推荐