今年315晚会把「GEO」这个概念推到了公众面前。服务商只需3000元,就能通过批量发布虚假内容,让虚构产品出现在ChatGPT、Perplexity等AI搜索的回答中。

一时间,「GEO = 给AI投毒」似乎成了共识。

但这其实是个误解。GEO(Generative Engine Optimization,生成式引擎优化)本质上就是AI搜索时代的SEO。传统搜索引擎时代,网站通过SEO让自己排名靠前;生成式搜索引擎时代,内容提供者通过GEO让自己的内容更容易被AI引用。

需求本身是合理的。问题出在方法上。

315曝光的是「对抗式GEO」:通过欺骗手段强行提升可见度,代价是污染整个搜索生态。那么,有没有一种GEO方式,既能提升内容的可见度,又不损害AI搜索的回答质量?

来自CMU的ICLR 2026论文提出AutoGEO,系统地回答了这个问题。

在这里插入图片描述

一、先搞清楚问题:为什么对抗式GEO是条死路?

论文做了一个非常直观的对比实验,把AutoGEO和两种对抗式方法(Hijack Attack、Poisoning Attack)放在一起评测。

结果一目了然:
在这里插入图片描述
对抗式方法 (Attack) 带来GEO性能提升,但是也带来回答质量GEU下降

  • 对抗式方法:可见度确实提升了,但搜索引擎的回答质量全面下降。精确度、清晰度、洞察力全线低于不做任何优化的基线。
  • AutoGEO:可见度提升到43.76(远超对抗式),同时搜索质量指标不降反升。

这意味着什么?315曝光的那类服务商做的事情,学术上已经被量化证明是「损人利己」。短期确实能提升曝光,但搜索引擎的回答会因此变差。

而更讽刺的是,AutoGEO用合作式方法达到的可见度提升(43.76),远高于对抗式方法(~31)。也就是说,投毒不仅伤害了搜索生态,效果还不如正经方法好。

二、AutoGEO的核心思路:让AI自己告诉你它喜欢什么

AutoGEO的方法论很简洁:与其猜引擎喜欢什么,不如从引擎的实际行为中自动提取规则。
在这里插入图片描述

具体来说,对于同一个查询,生成式引擎检索到的多个文档,可见度会有高低之分。AutoGEO让LLM对比高可见度和低可见度文档的差异,从中提炼出引擎的偏好规则。

整个流程分四步:

  1. 解释:对比文档对,让LLM分析为什么这个文档被引用更多
  2. 提取:从大量分析中提炼结构化的核心因素
  3. 合并:将数万条因素汇总为候选规则(使用分层合并策略确保可扩展性)
  4. 过滤:去除模糊规则,只保留验证有效的核心规则

最终得到一套可解释、可执行的规则集

有了规则之后,AutoGEO提供两种使用方式:

  • AutoGEO API:直接把规则注入prompt调用大模型API改写文档,零训练成本
  • AutoGEO Mini:用规则作为奖励信号,通过强化学习训练一个1.7B的小模型(Qwen3-1.7B),推理成本仅为API版的0.71%,可在CPU上离线运行

三、这种合作式GEO性能怎么样?

论文在三个数据集(通用的GEO-Bench和Researchy-GEO、电商的E-commerce)、三个主流LLM驱动的引擎(Gemini、GPT、Claude)上做了全面评测。

核心数字:

  • AutoGEO API相比此前最强方法(Fluency Optimization),最高提升50.99%
  • AutoGEO Mini(1.7B小模型)平均提升20.99%,成本仅为API版的0.71%
  • 在所有引擎上,搜索质量指标(Precision、Recall、Clarity、Insight)全部维持在基线水平甚至略有提升

50.99%的提升是什么概念?最强基线的Overall指标是27.75,AutoGEO API达到43.76。差距不是微调级别的改进,而是量级上的跨越。
在这里插入图片描述

四、规则分析揭示了什么?

这部分发现对所有关注AI搜索的人都有参考价值。

发现一:不同AI引擎的偏好高度一致。

Gemini、GPT、Claude三个引擎提取出的规则重叠率在79%~84%之间。说明「好内容」的标准在不同AI引擎之间是相通的——不需要为每个引擎做完全不同的优化。

发现二:不同领域的偏好差异很大。

通用研究类问题的规则重叠高达88%,但涉及电商领域时降到35%。具体来说:

  • 研究领域:偏好「深度解释」「因果分析」「全面覆盖」
  • 电商领域:偏好「可操作的步骤指引」「模块化信息结构」

这给内容创作者一个实用启示:领域比引擎更重要。针对你所在领域的偏好做优化,性价比最高。

发现三:定制规则最优,但通用规则也有效。

即使直接把Gemini的规则用到Claude上、把研究类的规则用到电商上,效果仍然显著优于不使用规则的基线。但量身定制的规则效果最好,这验证了AutoGEO自动化规则发现的价值。

五、一个更根本的问题:GEO的未来走向

回到开头的问题。315把GEO推上了风口浪尖,但真正值得关注的不是「GEO该不该做」,而是「GEO该怎么做」。

AutoGEO给出的答案是:合作式优化

这个逻辑其实和SEO的演进路径一模一样。早期SEO也经历过关键词堆砌、隐藏文字、链接农场等「黑帽」阶段,最终Google通过算法升级让这些手段失效,优质内容+合规优化成为主流。

GEO大概率会走同样的路。对抗式方法(投毒、注入干扰指令)也许短期有效,但随着AI引擎的防御能力提升,这类方法的生存空间会越来越小。而理解引擎偏好、按规则优化内容的合作式方法,才是长期可持续的策略。

AutoGEO的数据已经证明了这一点:合作式方法不仅效果远好于对抗式,而且不会伤害搜索生态。

六、小结

315曝光的是GEO技术被滥用的问题,但AutoGEO说明了一件事:正确的GEO不是给AI投毒,而是帮优质内容获得它应有的可见度。 这和SEO从黑帽走向白帽的历史,本质上是同一个故事。

  • 论文What Generative Search Engines Like and How to Optimize Web Content Cooperatively(ICLR 2026)
  • 代码 & Demogithub.com/cxcscmu/AutoGEO
Logo

AtomGit 是由开放原子开源基金会联合 CSDN 等生态伙伴共同推出的新一代开源与人工智能协作平台。平台坚持“开放、中立、公益”的理念,把代码托管、模型共享、数据集托管、智能体开发体验和算力服务整合在一起,为开发者提供从开发、训练到部署的一站式体验。

更多推荐