[SEO艺术重读] 第2篇 搜索引擎原理
首次披露2026年SERP特征优先级排名(Thumbnail > Image pack > Sitelinks > Videos > AI Overview),并结合Sparkfun案例实证了结构化教程内容是撬动52% AIO流量的关键。
搜索引擎就好比数字世界的‘高级房产中介’,它不盖房子,但它通过分析房子的装修(内容)和街坊评价(链接),决定把谁推荐给最急需的买家。
目录
什么是2026最新的谷歌搜索结果页(Goolge SERPs)?
搜索引擎如何在SERPS页面展示:易混淆词组、消除歧义以及差异性?
如何分析和判断哪些排名因素更加重要 VS 不良排名因素 VS 其他排名因素?
原创 Adairz Adair 代呆呆 2026年4月18日 10:26 上海
-
本文是「SEO重读」系列第2篇
-
系列共15篇,完整目录见[SEO艺术重读]
-
作者:[Adair]
-
下一篇:[SEO艺术重读 第3篇 定制你的策略]
什么是2026最新的谷歌搜索结果页(Goolge SERPs)?

如果你有还没有读过Adair基于Ahrefs数据的开源硬件行业AIO研究,证实结构化教程类内容是撬动AI Overview流量的关键因素,其中Sparkfun的全量词AI Overview占比可达52%。建议先移步阅读。
在后续的调研中发现,几家在AI Overview可见性表现优异的公司,
共同点是:在谷歌搜索结果页中的排名如下
SERP features
-
第一名:Thumbnail
-
第二名:Image pack
-
第三名:Sitelinks
-
第四名:Videos
-
第五名:AI Overview
-
Featured snippet
-
Top stories
-
Discussions and forums
-
X (Twitter)
-
Knowledge card
-
Knowledge panel
-
Video preview
什么是垂直内容?
我们在浏览抖音、小红书内容的时候,点开创作者的主页,会有标签。作者可能分享的是某个领域的专业内容,看发布列表,如果所有发布的内容都是这个领域的,一般就成为垂直内容。
垂直搜索结果是如何展示的?
谷歌展示垂直的搜索内容的目的,是为了让你快速熟悉和了解你想探索的内容。谷歌提供了很多取景框,想象一下你的相机,有时候是全景,近景。
搜索引擎除了可以提供【图2】的结果,对很多类型的查询,搜索引擎显示垂直搜索结果,或者即时答案,不仅包含链接到其他网站的许多链接还可以帮助用户解答问题。
在谷歌搜索 什么是人体存在传感器?
最新的搜索结果页面增加了AI概览。点击进行就可以进行对话。
搜索 "上海天气",甚至不需要点击。
搜索人物信息
正如 图3、4、5 所示,很多搜索结果中的信息合并能够让我们在搜索结果页就获得大量的信息,搜索引擎通过提供更相关的搜索结果以及对搜索条目更有针对性的垂直搜索答案而互相竞争,而非通过网页。
对网站拥有者和网页营销人员必须考虑垂直搜索结果的合并对他们的排名和流量产生什么影响。
思考一下,如果有一个新产品上市,你的内容策略是怎么样的?
-
Product info and reviews
-
用户具体的案例
-
选型对比类 VS
-
客户主动分享的内容
-
forum ugc 产生的具体问题和解决方案
教你用Google Search Console正则筛选商业意图关键词,参照头部玩家的「主题权威+全漏斗内容」布局,让品牌在ChatGPT、Perplexity等AI搜索生态中获得稳定曝光。
谷歌是如何基于算法的排名系统:爬取、建立索引、排名?
我们延续 SEO艺术重读 第1篇 搜索:反映意识并连接商业契机 的三方,
生产者提供内容,消费者(用户)消费内容,搜索引擎作为中介。
想象互联网是一座巨大的城市,每一篇网页内容都是一栋待售的房子。
-
生产者(网站方):是房东,负责盖房子、搞装修。
-
消费者(用户):是购房者,他们带着具体的需求(搜索词)——比如“三室一厅、带南向阳台、学区房”。
-
搜索引擎、大语言模型(中介):就是数字世界的“链家”。
(搜索引擎)了解如何爬取、建立索引。
排名的效用机制对搜索引擎优化实操人员(生产者)来说很有帮助。
能够帮助(生产者)来确定采取哪些行动来实现SEO目标。
(消费者(用户))可以实现更高效的探索体验和结果。
搜索引擎如何抓取?
第一步,从一组高质量的种子网站开始,然后访问这些网站中每个页面中的链接从而发现其他的网站。
第二步,网络的链接结构是通过其他页面的链接将所有的公开网页都串联在一起。通过链接,搜索引擎的爬虫,可以访问互相链接的文档。
第三步,搜索引擎会加载页面,并对内容进行分析,页面链接到了哪里。
第四步,搜索引擎会加载链接的其他页面并分析内容,这个过程不断重复直到爬取过程结束为止。
搜索引擎并不是每天都会爬取整个网络的。搜索引擎爬取的过程,
第一步是建立术语索引。这是一个巨大的数据库。搜索引擎会为爬取的每一个页面重要术语都做了分类。链接到的地图、锚文本。
消费者(用户)在使用搜索时的检索和排名的规则是怎样的?
用户在搜索框搜索内容,
搜索引擎 首先,仅仅返还与搜索用户查询词相关的条目;
其次根据重要性对搜索结果进行排序(要考虑网站的可信度和权威程度)。
-
相关性 是指搜索提供的文档内容与用户查询的意图和术语的匹配程度。
-
生产者机会:文档内容使用了相关术语、相关的锚文本、图片alt属性的。
-
-
重要性 是指相关程度的重要性,通过衡量匹配用户查询的文档引用情况 即PageView(某个作品借鉴另外一个作品的行为,经常出现在学术和业务文档中)来确定。
-
PageView:某个给定文档的重要性随着其他文档的借鉴的次数增加,其重要性也同比增加。引用可能是通过链接到文档的形式或者在社交媒体网站上的借鉴来实现的。确定如何为这些信号划分权重被称为引证分析。
-
重要性和相关性不是通过人为决定其重要性的。
而是搜索引擎的算法, 这些算法包含几百种组成元素。
在搜索营销领域,一般称它们为排名因素或算法排名标准。
搜索引擎是如何评估网页的内容的?以及生产者的机会在哪里?
搜索引擎 VS 消费者(用户) VS生产者 的关系
搜索引擎将很大的权重放到每个网页的内容上。
搜索引擎对网页中出现的所有文字和词语进行详细的分析,然后创建数据图。
这样在消费者(用户)输入相关的搜索查询词时,就能借鉴这个图来确定在搜索结果中的位置。这个图一般被称为语义图。
用来确定这些概念之间的关系,从而搜索引擎可以更好的理解如何正确的匹配网页和消费者(用户)的搜索查询词。
如果某个查询词,生产者网页没有相应的内容语义匹配,这个网页出现在搜索结果中的可能性就会很小。
你放在网页中的词语,以及网页的“主体”,在排名中的作用很关键。
如何确定什么是网页中的独特内容?
页面中的导航很重要,但是它不能帮助搜索引擎确定网页中有什么独特的内容。
搜索引擎需要确定内容的价值。
-
通过获取网页的内容来生成一些结论;
-
通过其他网页对本页面内容的投票来分析某条内容的价值。
生产者机会
-
其他网址是否会出现这个页面中的内容?
-
搜索引擎看到的特殊内容是两个句子还是500字长?
-
内容是不是不断地重复相同的关键词?
-
在确定某条内容的价值时,搜索引擎是通过若干个因素来衡量的。
如何了解搜索引擎在网页上可以 看到 VS 看不到的内容?
搜索引擎主要是通过页面源代码来看到内容。
能看到内容:
-
网页标题:也是某个页面排名中最重要的部分。
-
元描述标签: meta_description。搜索引擎会将元描述、结构化描述、社交媒体描述作为搜索结果的描述的部分。一个写的很好的元描述可以很大程度地影响你网站获得的点击量,点击量又会影响你的排名。
-
图片的alt属性:alt属性本来是用来呈现给那些无法查看图片的用户的信息。
-
有视觉障碍的用户无法浏览图片;
-
为了快速冲浪而把图片关闭的用户。这一般是没有宽带连接用户容易出现的问题。
-
看不到内容:
-
无法分辨一张图片;
-
不能读取flash文档;
-
任何包含在flash中的图片元素;
-
音频和视频都很难阅读;
-
AJAX技术;
-
嵌入式标签<embed>;
如何确定搜索用户意图并传达相关、新鲜内容?
商业搜索引擎主要依靠信息检索(IR)的技术,
IR科学家认为搜索由2个重要部分在组成:
-
相关性(文档中概念的语义分析)
-
重要性(引证分析)
文档分析和语义连贯性
搜索引擎查看搜索术语是否出现在文档的重要区域:
标题、元数据、标题标签、文本正文中。
除了这些,还会关注语义连贯性。
语义连贯性指的是字词之间的正常关联。
比如:提到雷军,可能就会想到小米。
搜索引擎正在积极的创建自己的辞典和词典来帮助确定哪些术语和哪些主题是相关联的。像知识图谱。 通过简单的扫描其网络内容庞大的数据库,可以使用模糊集理论以及某些特定的等式来链接术语并且开始像人类一样地理解网页和网站。
如果使用语义连同衡量方法获取运营优势?
-
衡量定位哪些关键词短语;
-
衡量在关于某个话题的页面应该涵盖哪些关键词;
-
衡量其他具有较高排名的网站和页面的文本关系;
-
查找提供"相关"主题链接的页面。
在IR的世界有成百上千的技术术语,常见的搜索类型有以下几种:
-
近似搜索:利用搜索短语的顺序来查找相关的文档。
-
比如在 谷歌搜索 ai 可见性,显示的列表不是完全按照搜索短语顺序相匹配的。
-
图6 谷歌搜索 ai 可见性,显示的列表不是完全按照搜索短语顺序相匹配的。
-
-
模糊逻辑:不区分对错的逻辑。在搜索中,模糊逻辑一般用于误拼。
-
布尔搜索法:使用布尔搜索术语AND、OR以及NOT进行的搜索。这种类型的逻辑用来扩展或者限制搜索中查找的文档信息。
-
术语权重:术语权重指的是针对某项查询,某个特定搜索术语的重要性。目的是为了给某些特定的术语更多的权重从而产生很好的搜索结果。
使用模糊逻辑的地方,使用模糊集理论通过衡量术语一起出现的频率以及场景,
可帮助电脑确定术语之间的联系。
比如香蕉和橘子都是水果,但它们并不都是圆形的。人类靠"系统1"自动识别。
机器理解香蕉和橘子不都是圆形,需要使用语义连贯性。比如谷歌的“Hummingbird”(蜂鸟)。
比如搜索 "指数基金" :
位置1:AI概览,可以展开进入进一步对话,对这个话题可进行深入交流。是GEO的机会。
位置2:是指数基金和ETF关联;
位置4:是相关问题。 关于指数基金这个话题,其他人还问了哪些问题?
对SEO来说,这种分析让我们见识了搜索引擎可以识别网络上的词语、话题之间的关系。
随着语义连通性成为搜索引擎算法里面更大的一部分,
可以把重点放在网站和页面的主题以及链接上。
将来搜索引擎能够根据主题和想法来识别某个网站中不合适的内容、链接以及页面。
内容质量和用户参与度
搜索引擎会尝试判断某个网站的内容质量和独特程度。
-
评估文档本身:网页有没有拼写或语法错误,这可能代表在其中投入的编辑审校精力较少。
-
分析文档的可读性:会考虑平均字词的长度以及每个句子的单词来确定理解这些句子需要具备的教育程度。
-
如果你的网站卖的东西是给孩子的电子硬件产品,但搜索引擎计算可读性为专业人员水平。那就说明编辑水平有限。
-
-
衡量页面实际用户交互: 想一想抖音、小红书 (点赞,收藏,转发)、淘宝、京东的用户评价等;
-
Google Analytics(谷歌分析):
-
跳出率:只访问你的网站中一个页面的访客占比。
-
网站停留时间:这个指标能够告诉你加载第一个页面到加载最后一个页面之间的平均时长,但是不包含在最后一页加载时访客花费的时间。
-
页面浏览量/访客:平均每个访客访问的页面数量。
-
如果你的网站有更好的用户交互指标,这可能就代表着质量较高,相比于你的竞争对手你的排名可能会更高。
可以去看看 schema.org 关于用户交互的数据采集,和在搜索结果页面富文本的展示。
链接分析
搜索引擎可以通过链接分析以及语义分析来判定一个网站或者网页是否权威。
-
搜索引擎衡量有谁链接到网站或者某个网页;
-
以及他们对这个网站或者网页的评价。
-
同样它们也能抓住其中的关联(通过历史链接数据、网站的登记记录以及其他资源);
-
基于链接到的网站的权威程度;
-
网站托管网页的上下文数据(谁链接到网站、他们对网站的意见,等等)
来判断哪些网站值得信赖。
确定链接价值的因素有哪些?
-
搜索引擎算法中“邻域(Neighborhood)”和“信任传递”的核心逻辑。
-
群组网站的概念基于哪些网站链接到它们,以及它们链接到哪些网站,这就是link neighborhood。你所在的neighborhood讲了关于你的网站的事情,你的网站获得的链接的数量和质量就表明了你的网站的重要程度。
-
“物以类聚,站以群分”。如果你身边的社交圈全是清华、北大的学霸,即便别人还不了解你,也会默认你的学习能力、认知水平处于同梯队。
-
-
链接本身的文本信息即锚文本,如果文本信息富含关键词(关键词与你的目标搜索术语相关),比起不含有关键词的锚文本,它能够帮助你提高搜索引擎排名。
-
比如 "点击这里" VS "包含关键词的语义化锚文本"
-
搜索引擎如何在SERPS页面展示:易混淆词组、消除歧义以及差异性?
比如上面搜索的指数基金
搜索引擎会想:
-
你要探索什么是指数基金? - 信息型查询意图
-
指数基金和ETF的区别? -商业调查性意图
-
你要买入指数基金? -交易性查询意图
搜索引擎处理这种用户意图不明确的方法有哪些?
-
查询此用户之前输入的搜索条目来判断用户的意图,上下文。
-
提供不同的结果,内容多样化(Query Deserves Diversity,QDD)。
新鲜感在哪里比较重要?
在大多数时间里,搜索引擎从比较陈旧的经得住时间考验的资源中获取搜索结果是有道理的。
需要实时地发现信息并且对新的信息进行检索。谷歌将这种概念称之为内容新鲜度(QDF)。
内容新鲜度(QDF)考虑的因素有哪些?
-
搜索量;
-
新闻报道;
-
博客报道。
内容新鲜度适用于最新的新闻报道,也适用于其他场景,例如热门的、新折扣的交易或者获取很多搜索量和媒体报道的新产品发布。
为什么搜索引擎这些算法有时候还是不准呢?
-
用户搜索的输入的关键词太少,不能显示他们的搜索意图;
-
有的搜索词语有多重含义,比如"小米";

什么是知识图谱?
传统的搜索结果是由搜索引擎爬取并且分析网页来获取信息的,然后将信息呈现在搜索结果中。
谷歌积极主动地创建信息数据库,远远超过了传统的基于网页的搜索模式。
知识图谱更多地是在搜索结果中关于提供丰富的信息,通常不需要用户点击网站就能够直接回答用户的问题。
谷歌对更加可信赖的信息来源进行投资,包括网站,在搜索中提供直接搜索答案。谷歌将这些称之为“有特色的片段”。
如何分析和判断哪些排名因素更加重要 VS 不良排名因素 VS 其他排名因素?
排名重要因素:
-
域级链接权威性:域级链接权威性是对链接到某个域的所有链接的累计链接分析。
-
链接到网站的其他域名的数量;
-
那些域名的信任度/权威性;
-
新嵌入链接的添加速度;
-
链接域的相关性;
-
-
页面等级链接指标:与特定网页相关的链接,诸如链接的数量、链接的相关性,以及页面中链接受到的信任度和其权威性。
-
页面等级关键词和内容:在页面中HTML编码部分使用的关键词术语/词组(<title>标签、<h1>、alt属性,等等)。
-
除关键词之外的其他页面等级特征:如页面的链接数量、内部链接的数量、追踪链接的数量、“不追踪”链接的数量,以及其他相似的因素。
-
域级品牌指标:包括网站品牌名称、提及的搜索量、是否在社交媒体出现过,以及其他和品牌相关的指标。
-
页面流量/查询数据:指搜索结果中对某个页面的点击量、跳出率,以及其他相关的衡量指标。
-
页面等级社交指标:社交指标包括提及量、链接量、分享量、点赞量,以及其他和社交媒体网站相关的指标。
-
域级关键词用法:是在根目录或者子域名中如何使用关键词,以及这对搜索引擎排名有什么影响。
-
域级关键词待定功能:主要成分包括域名中的连字符的数量、域名中字母的数量以及域名的长度。
不良排名因素:
-
网站存在恶意软件:搜索引擎会快速封锁含有病毒或者木马的网站。
-
遮址:搜索引擎希望网站开发商向搜索引擎以及用户展示相同的内容。
-
网站中含有销售链接的网页:谷歌对付费搜索链接要求很严格,那些销售链接的网站可能会受到处罚。
-
网站中的广告支付链接内容:作为对上一个不良排名因素的扩展,对付费链接的销售行为进行宣传也可能被视为不良排名因素。
-
页面速度
其他排名因素:
-
收到链接的速度;
-
用户数据;
关于作者
我是一名自我探索的技术型S/A/GEO,近9年外贸独立站开发&运维经验。
正在探索内容在AI可见性。
欢迎有同样兴趣的朋友关注我。后续会陆续更新我的AEO探索之旅。
欢迎 ❤️ 点赞 | 🔔 关注 | ⭐️ 收藏 | 💬 评论
你的每一个反馈,对我都很重要,是我持续输出的动力~
AtomGit 是由开放原子开源基金会联合 CSDN 等生态伙伴共同推出的新一代开源与人工智能协作平台。平台坚持“开放、中立、公益”的理念,把代码托管、模型共享、数据集托管、智能体开发体验和算力服务整合在一起,为开发者提供从开发、训练到部署的一站式体验。
更多推荐

所有评论(0)