315 曝光了GEO投毒,但「正确的GEO」应该长什么样?
今年315晚会把「GEO」这个概念推到了公众面前。服务商只需3000元,就能通过批量发布虚假内容,让虚构产品出现在ChatGPT、Perplexity等AI搜索的回答中。
一时间,「GEO = 给AI投毒」似乎成了共识。
但这其实是个误解。GEO(Generative Engine Optimization,生成式引擎优化)本质上就是AI搜索时代的SEO。传统搜索引擎时代,网站通过SEO让自己排名靠前;生成式搜索引擎时代,内容提供者通过GEO让自己的内容更容易被AI引用。
需求本身是合理的。问题出在方法上。
315曝光的是「对抗式GEO」:通过欺骗手段强行提升可见度,代价是污染整个搜索生态。那么,有没有一种GEO方式,既能提升内容的可见度,又不损害AI搜索的回答质量?
来自CMU的ICLR 2026论文提出AutoGEO,系统地回答了这个问题。

- 论文:What Generative Search Engines Like and How to Optimize Web Content Cooperatively
- 代码 & Demo:https://github.com/cxcscmu/AutoGEO
一、先搞清楚问题:为什么对抗式GEO是条死路?
论文做了一个非常直观的对比实验,把AutoGEO和两种对抗式方法(Hijack Attack、Poisoning Attack)放在一起评测。
结果一目了然:
对抗式方法 (Attack) 带来GEO性能提升,但是也带来回答质量GEU下降
- 对抗式方法:可见度确实提升了,但搜索引擎的回答质量全面下降。精确度、清晰度、洞察力全线低于不做任何优化的基线。
- AutoGEO:可见度提升到43.76(远超对抗式),同时搜索质量指标不降反升。
这意味着什么?315曝光的那类服务商做的事情,学术上已经被量化证明是「损人利己」。短期确实能提升曝光,但搜索引擎的回答会因此变差。
而更讽刺的是,AutoGEO用合作式方法达到的可见度提升(43.76),远高于对抗式方法(~31)。也就是说,投毒不仅伤害了搜索生态,效果还不如正经方法好。
二、AutoGEO的核心思路:让AI自己告诉你它喜欢什么
AutoGEO的方法论很简洁:与其猜引擎喜欢什么,不如从引擎的实际行为中自动提取规则。
具体来说,对于同一个查询,生成式引擎检索到的多个文档,可见度会有高低之分。AutoGEO让LLM对比高可见度和低可见度文档的差异,从中提炼出引擎的偏好规则。
整个流程分四步:
- 解释:对比文档对,让LLM分析为什么这个文档被引用更多
- 提取:从大量分析中提炼结构化的核心因素
- 合并:将数万条因素汇总为候选规则(使用分层合并策略确保可扩展性)
- 过滤:去除模糊规则,只保留验证有效的核心规则
最终得到一套可解释、可执行的规则集。
有了规则之后,AutoGEO提供两种使用方式:
- AutoGEO API:直接把规则注入prompt调用大模型API改写文档,零训练成本
- AutoGEO Mini:用规则作为奖励信号,通过强化学习训练一个1.7B的小模型(Qwen3-1.7B),推理成本仅为API版的0.71%,可在CPU上离线运行
三、这种合作式GEO性能怎么样?
论文在三个数据集(通用的GEO-Bench和Researchy-GEO、电商的E-commerce)、三个主流LLM驱动的引擎(Gemini、GPT、Claude)上做了全面评测。
核心数字:
- AutoGEO API相比此前最强方法(Fluency Optimization),最高提升50.99%
- AutoGEO Mini(1.7B小模型)平均提升20.99%,成本仅为API版的0.71%
- 在所有引擎上,搜索质量指标(Precision、Recall、Clarity、Insight)全部维持在基线水平甚至略有提升
50.99%的提升是什么概念?最强基线的Overall指标是27.75,AutoGEO API达到43.76。差距不是微调级别的改进,而是量级上的跨越。
四、规则分析揭示了什么?
这部分发现对所有关注AI搜索的人都有参考价值。
发现一:不同AI引擎的偏好高度一致。
Gemini、GPT、Claude三个引擎提取出的规则重叠率在79%~84%之间。说明「好内容」的标准在不同AI引擎之间是相通的——不需要为每个引擎做完全不同的优化。
发现二:不同领域的偏好差异很大。
通用研究类问题的规则重叠高达88%,但涉及电商领域时降到35%。具体来说:
- 研究领域:偏好「深度解释」「因果分析」「全面覆盖」
- 电商领域:偏好「可操作的步骤指引」「模块化信息结构」
这给内容创作者一个实用启示:领域比引擎更重要。针对你所在领域的偏好做优化,性价比最高。
发现三:定制规则最优,但通用规则也有效。
即使直接把Gemini的规则用到Claude上、把研究类的规则用到电商上,效果仍然显著优于不使用规则的基线。但量身定制的规则效果最好,这验证了AutoGEO自动化规则发现的价值。
五、一个更根本的问题:GEO的未来走向
回到开头的问题。315把GEO推上了风口浪尖,但真正值得关注的不是「GEO该不该做」,而是「GEO该怎么做」。
AutoGEO给出的答案是:合作式优化。
这个逻辑其实和SEO的演进路径一模一样。早期SEO也经历过关键词堆砌、隐藏文字、链接农场等「黑帽」阶段,最终Google通过算法升级让这些手段失效,优质内容+合规优化成为主流。
GEO大概率会走同样的路。对抗式方法(投毒、注入干扰指令)也许短期有效,但随着AI引擎的防御能力提升,这类方法的生存空间会越来越小。而理解引擎偏好、按规则优化内容的合作式方法,才是长期可持续的策略。
AutoGEO的数据已经证明了这一点:合作式方法不仅效果远好于对抗式,而且不会伤害搜索生态。
六、小结
315曝光的是GEO技术被滥用的问题,但AutoGEO说明了一件事:正确的GEO不是给AI投毒,而是帮优质内容获得它应有的可见度。 这和SEO从黑帽走向白帽的历史,本质上是同一个故事。
- 论文:What Generative Search Engines Like and How to Optimize Web Content Cooperatively(ICLR 2026)
- 代码 & Demo:github.com/cxcscmu/AutoGEO
AtomGit 是由开放原子开源基金会联合 CSDN 等生态伙伴共同推出的新一代开源与人工智能协作平台。平台坚持“开放、中立、公益”的理念,把代码托管、模型共享、数据集托管、智能体开发体验和算力服务整合在一起,为开发者提供从开发、训练到部署的一站式体验。
更多推荐

所有评论(0)