315 曝光了GEO投毒，但「正确的GEO」应该长什么样？

MaoziShan

424人浏览 · 2026-03-17 09:06:52

MaoziShan · 2026-03-17 09:06:52 发布

今年315晚会把「GEO」这个概念推到了公众面前。服务商只需3000元，就能通过批量发布虚假内容，让虚构产品出现在ChatGPT、Perplexity等AI搜索的回答中。

一时间，「GEO = 给AI投毒」似乎成了共识。

但这其实是个误解。GEO（Generative Engine Optimization，生成式引擎优化）本质上就是AI搜索时代的SEO。传统搜索引擎时代，网站通过SEO让自己排名靠前；生成式搜索引擎时代，内容提供者通过GEO让自己的内容更容易被AI引用。

需求本身是合理的。问题出在方法上。

315曝光的是「对抗式GEO」：通过欺骗手段强行提升可见度，代价是污染整个搜索生态。那么，有没有一种GEO方式，既能提升内容的可见度，又不损害AI搜索的回答质量？

来自CMU的ICLR 2026论文提出AutoGEO，系统地回答了这个问题。

在这里插入图片描述

论文：What Generative Search Engines Like and How to Optimize Web Content Cooperatively
代码 & Demo：https://github.com/cxcscmu/AutoGEO

一、先搞清楚问题：为什么对抗式GEO是条死路？

论文做了一个非常直观的对比实验，把AutoGEO和两种对抗式方法（Hijack Attack、Poisoning Attack）放在一起评测。

结果一目了然：
在这里插入图片描述
对抗式方法 (Attack) 带来GEO性能提升，但是也带来回答质量GEU下降

对抗式方法：可见度确实提升了，但搜索引擎的回答质量全面下降。精确度、清晰度、洞察力全线低于不做任何优化的基线。
AutoGEO：可见度提升到43.76（远超对抗式），同时搜索质量指标不降反升。

这意味着什么？315曝光的那类服务商做的事情，学术上已经被量化证明是「损人利己」。短期确实能提升曝光，但搜索引擎的回答会因此变差。

而更讽刺的是，AutoGEO用合作式方法达到的可见度提升（43.76），远高于对抗式方法（~31）。也就是说，投毒不仅伤害了搜索生态，效果还不如正经方法好。

二、AutoGEO的核心思路：让AI自己告诉你它喜欢什么

AutoGEO的方法论很简洁：与其猜引擎喜欢什么，不如从引擎的实际行为中自动提取规则。
在这里插入图片描述

具体来说，对于同一个查询，生成式引擎检索到的多个文档，可见度会有高低之分。AutoGEO让LLM对比高可见度和低可见度文档的差异，从中提炼出引擎的偏好规则。

整个流程分四步：

解释：对比文档对，让LLM分析为什么这个文档被引用更多
提取：从大量分析中提炼结构化的核心因素
合并：将数万条因素汇总为候选规则（使用分层合并策略确保可扩展性）
过滤：去除模糊规则，只保留验证有效的核心规则

最终得到一套可解释、可执行的规则集。

有了规则之后，AutoGEO提供两种使用方式：

AutoGEO API：直接把规则注入prompt调用大模型API改写文档，零训练成本
AutoGEO Mini：用规则作为奖励信号，通过强化学习训练一个1.7B的小模型（Qwen3-1.7B），推理成本仅为API版的0.71%，可在CPU上离线运行

三、这种合作式GEO性能怎么样？

论文在三个数据集（通用的GEO-Bench和Researchy-GEO、电商的E-commerce）、三个主流LLM驱动的引擎（Gemini、GPT、Claude）上做了全面评测。

核心数字：

AutoGEO API相比此前最强方法（Fluency Optimization），最高提升50.99%
AutoGEO Mini（1.7B小模型）平均提升20.99%，成本仅为API版的0.71%
在所有引擎上，搜索质量指标（Precision、Recall、Clarity、Insight）全部维持在基线水平甚至略有提升

50.99%的提升是什么概念？最强基线的Overall指标是27.75，AutoGEO API达到43.76。差距不是微调级别的改进，而是量级上的跨越。
在这里插入图片描述

四、规则分析揭示了什么？

这部分发现对所有关注AI搜索的人都有参考价值。

发现一：不同AI引擎的偏好高度一致。

Gemini、GPT、Claude三个引擎提取出的规则重叠率在79%~84%之间。说明「好内容」的标准在不同AI引擎之间是相通的——不需要为每个引擎做完全不同的优化。

发现二：不同领域的偏好差异很大。

通用研究类问题的规则重叠高达88%，但涉及电商领域时降到35%。具体来说：

研究领域：偏好「深度解释」「因果分析」「全面覆盖」
电商领域：偏好「可操作的步骤指引」「模块化信息结构」

这给内容创作者一个实用启示：领域比引擎更重要。针对你所在领域的偏好做优化，性价比最高。

发现三：定制规则最优，但通用规则也有效。

即使直接把Gemini的规则用到Claude上、把研究类的规则用到电商上，效果仍然显著优于不使用规则的基线。但量身定制的规则效果最好，这验证了AutoGEO自动化规则发现的价值。

五、一个更根本的问题：GEO的未来走向

回到开头的问题。315把GEO推上了风口浪尖，但真正值得关注的不是「GEO该不该做」，而是「GEO该怎么做」。

AutoGEO给出的答案是：合作式优化。

这个逻辑其实和SEO的演进路径一模一样。早期SEO也经历过关键词堆砌、隐藏文字、链接农场等「黑帽」阶段，最终Google通过算法升级让这些手段失效，优质内容+合规优化成为主流。

GEO大概率会走同样的路。对抗式方法（投毒、注入干扰指令）也许短期有效，但随着AI引擎的防御能力提升，这类方法的生存空间会越来越小。而理解引擎偏好、按规则优化内容的合作式方法，才是长期可持续的策略。

AutoGEO的数据已经证明了这一点：合作式方法不仅效果远好于对抗式，而且不会伤害搜索生态。

六、小结

315曝光的是GEO技术被滥用的问题，但AutoGEO说明了一件事：正确的GEO不是给AI投毒，而是帮优质内容获得它应有的可见度。 这和SEO从黑帽走向白帽的历史，本质上是同一个故事。

论文：What Generative Search Engines Like and How to Optimize Web Content Cooperatively（ICLR 2026）
代码 & Demo：github.com/cxcscmu/AutoGEO

AtomGit开源社区

AtomGit 是由开放原子开源基金会联合 CSDN 等生态伙伴共同推出的新一代开源与人工智能协作平台。平台坚持“开放、中立、公益”的理念，把代码托管、模型共享、数据集托管、智能体开发体验和算力服务整合在一起，为开发者提供从开发、训练到部署的一站式体验。

更多推荐

AtomGit 6 月：AtomCode CodingPlan 上线 GLM-5.2！

AtomGit开源社区

行业 Agent 黑客松圆满收官：打通行业落地“最后一公里”

AtomGit开源社区

openJiuwen 总 Star 突破 3.3 万，与 AtomGit 携手构筑 AI Agent 的开源“生态飞轮”

AtomGit开源社区

所有评论(0)

查看更多评论

MaoziShan

@MaoziYa

已为社区贡献3条内容

315 曝光了GEO投毒，但「正确的GEO」应该长什么样？

MaoziShan

一、先搞清楚问题：为什么对抗式GEO是条死路？

二、AutoGEO的核心思路：让AI自己告诉你它喜欢什么

三、这种合作式GEO性能怎么样？

四、规则分析揭示了什么？

五、一个更根本的问题：GEO的未来走向

六、小结

所有评论(0)

温馨提示：您尚未绑定手机号

MaoziShan