GEO 不是 SEO:KDD 2024 那篇论文到底说了什么


一句话总结: KDD 2024 论文「GEO: Generative Engine Optimization」证明——给你的网站添加引用、数据和出处,可以将 AI 引用可见性提升高达 40%。而传统 SEO 的关键词堆砌完全无效。下面是论文的核心发现和落地方法。


如果你运营一个网站,你可能已经注意到一个趋势:来自 Google 的搜索流量在下降,但分析工具里却多了很多你解释不了的"直接访问"。那些其实是 AI 的回答。ChatGPT、Perplexity、Claude 和 Gemini 在读取你的内容,然后总结给用户——但没有给你带来点击。

这并非 Bug,而是新的搜索范式。

2023 年底,普林斯顿大学和 IIT Delhi 的研究团队发表了一篇论文,正式定义了这个转变并提出了解决方案——该论文被数据科学顶级会议 KDD 2024 接收。《GEO: Generative Engine Optimization》(Aggarwal 等,KDD 2024)已经成为 AI 搜索可见性领域的基础参考文献。

我花了几个月时间搭建了 GetCiteFlow,一个将这个研究落地的工具。下面我会拆解论文的核心发现、它们对你意味着什么,以及我们如何把这些研究成果变成了一个你今天就能用的工具。


1. 核心问题:三方博弈,一方受损

论文开篇将生成式引擎(Generative Engine,简称 GE)——包括带浏览功能的 ChatGPT、Perplexity、Gemini、Bing Chat 等——定义为一个新的搜索品类。与 Google 返回蓝色链接列表不同,GE 将多个来源的信息综合成单一答案

这创造了一个三方博弈:

角色 影响
用户 获得更快、更精准的答案
GE 开发者 更高参与度和收入
内容创作者 失去对内容何时如何被展示的控制

第三方就是问题所在。论文指出:“鉴于生成式引擎的黑箱和快速演进的特性,内容创作者对其内容的展示方式和时机几乎没有控制权。”

这就是 GEO 要填补的空白——一个黑箱优化框架,帮助内容创作者在不需要了解每个生成式引擎内部机制的前提下提升可见性。


2. 论文的核心发现:40% 的提升

最重要的结果:GEO 方法可将生成式引擎中的可见性提升高达 40%

但细节比标题更重要。研究人员在 GEO-bench(他们新引入的基准测试,涵盖 25 个领域、10,000 条查询)上评估了 9 种不同的优化策略

有效策略(按效果排序)

策略 可见性提升 做法
添加引用 ~40% 加入来自可信来源的直接引用
添加数据 ~30% 用数据替代定性描述
注明出处 ~25% 添加内联引用为论点背书
流畅性优化 ~25% 提升可读性和流畅度
技术术语 ~15% 使用精确的领域术语
易于理解 ~15% 简化复杂语言
权威语气 ~15% 使用自信、有说服力的语言

无效策略

策略 结果
关键词堆砌 零效果甚至负面
独特词汇 改善微乎其微

这是整篇论文中对内容创作者最重要的表格。传统的 SEO 手段——关键词密度、独特词汇——对生成式引擎毫无效果。真正起作用的是可信度信号:引用、数据、出处和清晰的语言。


3. 领域差异:没有万能方案

论文最有洞察力的发现之一是:GEO 策略因领域而异

策略 最佳领域
权威语气 辩论、历史、科学
注明出处 事实、声明、法律与政府
添加引用 人与社会、解释、历史
添加数据 法律与政府、辩论、观点
流畅性优化 商业、科学、健康

这意味着通用型的"AI 优化清单"是不够的。SaaS 公司需要的 GEO 策略和电商或医疗健康网站完全不同。


4. GEO 让小网站也能被看见

反直觉的发现:排名越低的网站,从 GEO 中受益越大

论文报告,Cite Sources(注明出处)策略让搜索引擎中排名第 5 的网站可见性提升了 115.1%,而同样的策略让排名第 1 的网站可见性下降了 30.3%。这很合理——生成式引擎基于内容质量进行条件生成,而不是外链或域名权重。小创作者可以纯粹靠内容竞争。

论文的结论值得直接引用:

“GEO 方法的应用为这些内容创作者提供了一个显著提升其在生成式引擎中可见性的机会。通过用 GEO 优化内容,他们可以触达更广泛的受众,实现公平竞争。”


5. 这在实际中意味着什么

论文提出了专门针对生成式引擎设计的可见性指标,包括位置调整词数(AI 为你的网站写了多少文字,按位置加权)和主观印象(你的引用给读者的影响力感受)。

这些不仅仅是学术概念。它们可以转化为具体的行动:

  1. 添加数据——把"产品很受欢迎"改成"产品服务了 50,000+ 团队"
  2. 添加引用——包含有具名来源的专家证言
  3. 注明出处——链接到支持你论点的研究报告和数据
  4. 结构清晰——使用清晰的标题、列表和摘要段落
  5. 添加结构化数据(FAQ Schema、HowTo 等)——虽然论文未直接研究此项,但在实践中,结构化的问答内容是 AI 提取信号最强的格式之一

6. 从研究到实践:GetCiteFlow

读论文是一回事,应用到自己的网站是另一回事。

在构建 GetCiteFlow 时,我们将分析引擎针对论文的 GEO-bench 框架进行了校准。我们的工具会从论文识别的多个维度——实体清晰度、FAQ 覆盖率、内容结构、llms.txt 存在性等——扫描你的网站,并给出 0-100 的 AI 可见性评分和按优先级排序的修复建议。

免费报告只需 30 秒:

  1. getciteflow.ai 输入你的网址
  2. 获取多维度的 AI 可见性诊断报告
  3. 按照优先级建议进行修复——从 FAQ Schema 代码片段到 llms.txt 内容

我们的 Brand Visibility 付费服务提供全站优化,而 AI Visibility Growth 是一个托管服务,在 AI 生态系统中系统性地建立品牌可见性——这正是论文所呼吁的领域特定策略。


总结

SEO 是关于关键词和外链的。GEO 是关于可信度和清晰度的。

2024 年的 KDD 论文确立了:生成式引擎对与传统搜索完全不同的信号做出响应。为 AI 引用做优化不是为了投机取巧——而是让你的内容真正更权威、更有结构、更易于引用。

今天就开始做这件事的网站,将在 AI 助手成为信息发现主要入口的明天获得复利优势。


GetCiteFlow 出品——AI 搜索时代的可见性分析平台。基于 Aggarwal 等,KDD 2024 的研究成果。

Logo

AtomGit 是由开放原子开源基金会联合 CSDN 等生态伙伴共同推出的新一代开源与人工智能协作平台。平台坚持“开放、中立、公益”的理念,把代码托管、模型共享、数据集托管、智能体开发体验和算力服务整合在一起,为开发者提供从开发、训练到部署的一站式体验。

更多推荐