AI 回答引擎里的可见度,已经不只是“页面有没有排名”。更关键的问题是:当你的页面和竞品页面都进入候选来源后,AI 为什么先引用对方?2026 年 5 月发布的论文 What Gets Cited: Competitive GEO in AI Answer Engines 给了一个很有价值的答案:主题匹配、候选位置、明确价格信息、更新时间,是跨多个模型都稳定影响首个引用来源的强信号。对 SEO 和内容团队来说,Competitive GEO 的工作重点不是堆格式,而是找到“被检索到之后为什么没被引用”的具体差距。
视频摘要:Competitive GEO 要先分清页面是没进入候选来源,还是进入后输给竞品。视频按论文结论讲清主题匹配、价格或可比较事实、更新时间、候选位置这四个优先门槛,再给出 prompt 记录、竞品来源对比、页面修复和复测的执行顺序。
Last updated: 2026-06-17
核心要点
Competitive GEO 的核心任务,是比较你的内容和竞品内容在 AI 回答中的引用胜率。先判断页面有没有进入候选来源,再判断它为什么没有成为被引用来源。这样做能把 GEO 从“感觉优化”变成可复测的内容诊断。
- 论文最值得吸收的结论:主题匹配、价格信息、更新时间和候选位置,是优先级最高的引用竞争因素。
- 传统 SEO 仍然是入口。Google 明确说 AI Overviews 和 AI Mode 的支持链接需要页面可被 Google Search 索引并有 snippet 资格;OpenAI 也把 OAI-SearchBot 与 ChatGPT 搜索展示关联起来。
- 内容修复不要先从“更好看的格式”开始。论文里格式类因素影响弱,优先修的是 query 相关性、关键事实、可验证证据、比较信息和时间戳。
- GEO 审计要分两层:没有被 AI 引用时,先查检索和技术可访问性;已经被引用但输给竞品时,再查内容竞争力。
- 最实用的交付物不是一篇泛泛的 GEO 文章,而是一张 prompt 测试表、一张引用来源记录表、一张竞品差距表和一组复测指标。
这篇论文到底证明了什么
What Gets Cited 研究的是一个很现实的问题:当两个候选页面都被送进 AI 回答引擎的上下文里,哪一个更容易被模型作为第一个引用来源。作者用双文档 RAG 测试环境,让两个来源每次只差一个内容因素,再跨 6 个模型跑了 252,000 次实验。
这和很多 GEO 经验文章不同。它不是观察某个真实搜索结果页面后倒推原因,而是把变量拆开测试。每次只改变一个因素,例如有没有价格、有没有规格、发布时间是新是旧、来源排在第一还是第二。作者还做了品牌匿名和顺序对调,尽量减少知名品牌和候选位置带来的干扰。
论文把 18 个因素分成内容匹配、完整性、可信度、可读性、竞争站位、 freshness 和位置偏差几类。结果很直接:最强的不是“页面写得更像清单”,而是“内容是不是对题、是否有关键事实、是否新、是否在候选列表靠前”。论文还报告,结构化排版和信息是否分散这类格式因素,没有跨模型稳定效果。
这给 GEO 从业者一个重要提醒:如果页面没有回答用户真正问的问题,或者缺少价格、规格、比较、证据这些能被答案使用的事实,单纯加 FAQ、加小标题、加 schema,很难把引用竞争拉回来。
| 论文发现 | 对内容团队的含义 | 审计时要问的问题 |
|---|---|---|
| On-topic vs off-topic 是最强信号之一 | 页面必须直接服务 prompt,不是只围绕大主题写 | 这一段是否直接回答了用户问题? |
| Price vs no price 效果稳定 | 商业、产品、工具类页面不能只写“联系销售” | 页面是否给出价格、价格区间或明确说明? |
| Recent vs old timestamp 效果稳定 | 时间敏感主题需要可见更新时间 | 页面是否显示最近更新时间,且内容确实更新? |
| Position 1 vs 2 影响极强 | 传统 SEO 和候选排序仍然重要 | 页面有没有先进入候选来源池? |
| Formatting-only edits 效果弱 | 不要把 GEO 简化成排版工程 | 这次改动是否增加了事实、证据或匹配度? |
我的判断是:这篇论文最适合被用来做 Competitive GEO 的审计优先级,而不是当作“AI 引用排名公式”。它的实验是受控的、清晰的,但不是完整真实搜索环境。真实系统还会受到索引、链接、品牌信任、用户地区、实时检索质量和界面设计影响。
Competitive GEO 和传统 GEO 有什么区别
传统 GEO 关注的是“怎样提高内容在生成式回答中的可见度”。GEO: Generative Engine Optimization 这篇 KDD 2024 论文把 GEO 定义为面向生成式引擎的内容可见度优化,并用 GEO-bench、visibility metrics 和内容改写方法证明,某些写法可以提升生成式回答中的展示机会。
Competitive GEO 更进一步。它不只问“我的页面能不能被 AI 使用”,而是问“当我的页面和竞品页面同时可用时,AI 为什么引用竞品”。这更接近增长团队每天遇到的问题:你并不是在真空里优化内容,你是在和 SERP 前排、第三方评测、竞品官网、社区讨论、媒体页面一起竞争答案里的一个引用槽。
| 层级 | 传统 SEO 问题 | GEO 问题 | Competitive GEO 问题 |
|---|---|---|---|
| 检索入口 | 我能不能排名和被抓取? | 我能不能进入 AI 可使用的来源池? | 我的页面和竞品谁更容易进入候选池? |
| 答案生成 | 页面标题和摘要是否吸引点击? | AI 是否正确理解并提到我? | AI 是否把竞品说得比我更清楚、更可信? |
| 引用选择 | 用户是否点击我的蓝链? | AI 是否引用我的 URL? | AI 为什么引用对方 URL 而不是我的 URL? |
| 修复对象 | Title、内链、技术 SEO、内容覆盖 | 实体、答案块、证据、结构、可抓取性 | 竞品差距、首引用原因、来源质量、事实完整度 |
这也是 Convertos.ai 这类 AI visibility 产品应该强化的方向:不要只告诉用户“你的品牌被提到了几次”,还要告诉他“竞品在哪些 prompt 下被引用,你没有;对方页面多了什么事实、比较或证据”。如果你要先做一次轻量检查,可以用 AI 可见性检查器 记录品牌提及、引用来源和竞品出现情况,再决定是否进入更深的内容修复。
AI 引用竞争的四个门槛
Competitive GEO 审计要先看门槛项。论文中跨 6 个模型都稳定的强因素包括:主题匹配、明确价格信息、近期时间戳和候选位置。它们不是全部答案,但足够决定第一轮优先级。
1. 主题匹配:页面要直接回答 prompt
AI 回答引擎通常不是读取整站后凭感觉引用,而是基于检索到的候选内容生成答案。Google 在 AI features and your website 中也提到,AI Overviews 和 AI Mode 会围绕问题展开相关搜索和支持链接。也就是说,页面必须先和具体问题对上。
一个常见错误是:页面主题相关,但答案不相关。例如用户问“best GEO tools for B2B SaaS”,你的页面只解释 GEO 定义,却没有工具、场景、价格、限制和选择标准。它可能相关,但不够回答这个 prompt。竞品如果有工具对比表,就更容易被引用。
2. 价格和规格:商业内容要给可用事实
论文里“有价格 vs 无价格”的差异很强。这个结果很好理解:当 AI 要回答购买、推荐、对比、选择类问题时,价格、规格、限制、适用对象是生成答案的材料。如果页面只写“联系我们获取报价”,AI 很难把它放进有用回答里。
这不代表所有 SaaS 都必须公开完整价格。至少可以提供价格边界、套餐逻辑、免费试用限制、适合团队规模,或者说明“定制报价通常取决于席位、数据量和使用场景”。关键是让 AI 和读者知道这项服务如何被比较。
3. 时间戳:变化快的主题必须让新旧可见
AI 搜索、GEO、模型、爬虫和 Google AI features 都变化快。论文发现近期时间戳比旧时间戳更容易赢得引用。这个结论不能被理解成“改日期就能赢”,更合理的做法是:页面显示更新时间,并让正文确实反映最新变化。
例如写 OpenAI 搜索可见性时,需要区分 OAI-SearchBot 与 GPTBot。OpenAI 文档说明,OAI-SearchBot 用于 ChatGPT 搜索结果展示,而 GPTBot 用于模型训练相关爬取控制。这样的页面如果没有更新时间,读者和 AI 都很难判断它是否仍然可靠。
4. 候选位置:SEO 没死,只是多了一层引用竞争
论文中的 position factor 很强,说明候选内容出现在前面仍然重要。Google 官方也说,AI Overviews 和 AI Mode 的支持链接需要页面可被 Google Search 索引并符合 snippet 展示资格;没有额外的专用 schema 能保证进入这些 AI features。
所以 Competitive GEO 不能脱离 SEO。一个页面如果无法被抓取、被索引、被内部链接发现,或者被 nosnippet 限制了摘要输入,后面的引用优化都很难发挥作用。Google 的 robots meta tag 文档 也明确说明,nosnippet 会影响内容作为 AI Overviews 和 AI Mode 直接输入的使用。
一张 Competitive GEO 审计表
把论文结论落到工作里,最好的形式是一张可复测的审计表。它要同时覆盖检索入口、内容匹配、事实完整度、证据、竞品差距和复测指标。
下面这张表可以直接作为第一版内容检查清单。评分不是为了装精确,而是为了让团队知道先修哪里。每项按 0-3 分记录:0 表示缺失,1 表示存在但弱,2 表示基本合格,3 表示强且可验证。
| 检查项 | 0 分常见表现 | 3 分表现 | 为什么影响 AI 引用 |
|---|---|---|---|
| Prompt 匹配 | 页面只讲大主题,没有直接回答问题 | H1、首段、H2 都围绕具体问题展开 | 检索和生成都依赖问题与内容的语义匹配 |
| 关键术语覆盖 | 缺少用户问题里的核心词和同义词 | 自然覆盖实体、产品类别、问题词和比较词 | 论文把 query terms 缺口列为差异因素 |
| 价格或成本边界 | 只写“联系销售” | 给出价格、范围、套餐逻辑或影响报价的因素 | 推荐和对比类答案需要可比较事实 |
| 规格和限制 | 没有功能、适用对象、限制 | 有功能、限制、场景和谁不适合 | AI 更容易抽取清楚结论 |
| 竞品比较 | 完全不提替代方案 | 给出公平比较、适用场景和 caveat | 对比型 prompt 常需要并列信息 |
| 证据靠近 claim | 大量口号,没有来源 | 关键事实旁边有论文、官方文档、测试或示例 | 论文中 evidence vs no evidence 是稳定差异项之一 |
| 更新时间 | 没有日期或明显陈旧 | 显示更新时间,并更新正文事实 | 近期时间戳在论文中是强信号 |
| 技术可访问性 | 被 noindex、robots 或脚本渲染阻碍 | 可抓取、可索引、正文为 HTML 文本 | 没进候选池就谈不上被引用 |
| 品牌实体一致性 | 品牌名、产品名、URL 写法混乱 | 名称、描述、schema、社媒、第三方资料一致 | 减少 AI 混淆品牌或产品 |
| 答案块可抽取 | 长段落没有结论 | 每个核心 H2 都有独立可引用回答 | 便于 AI 直接抽取定义、结论和步骤 |
如果你已经有待优化 URL,可以用 竞品 URL 对标工具 把自己的页面和 AI 已引用的竞品页面放在一起看。不要只比字数,要比“哪些事实和证据被竞品给出了,而你的页面没有”。
先分清:没被检索到,还是检索到了但没被引用
很多 GEO 诊断会跳过最关键的一步:先判断问题发生在哪一层。页面完全没进入候选来源,和页面进入候选来源但输给竞品,是两类问题。前者更像 SEO 和技术可访问性问题;后者才是 Competitive GEO 内容问题。
可以用下面的判断路径:
- 用固定 prompt 在 ChatGPT、Perplexity、Gemini、Google AI features 等目标平台记录答案。
- 看答案里是否提到你的品牌、产品或 URL。
- 如果没有提到,再看 AI 引用了哪些竞品或第三方来源。
- 用传统搜索检查你的页面是否能被搜索到、是否被索引、是否被 robots、noindex、nosnippet 或登录墙影响。
- 如果你的页面能被检索到,但 AI 仍引用竞品,就进入内容差距分析。
- 修复后,用同一组 prompt 在同一平台和相近时间段复测。
这里有一个边界要说清楚:Google 不承诺某个页面一定进入 AI Overviews 或 AI Mode。它的文档写得很保守:符合技术要求不等于一定被抓取、索引或展示。所以 GEO 报告不要承诺“修完一定被引用”。更可信的说法是:我们降低内容和技术上的失败概率,并持续记录引用变化。
如果你怀疑某个页面压根没被 AI 搜索系统拿到,可以先跑 单页 SEO + GEO 审核,看 indexability、正文可抓取性、结构化数据、snippet 限制和基础内容是否有明显问题。
Prompt 测试集应该怎么建
Competitive GEO 不能只问一个问题。一个品牌在定义型问题里可能被提到,在购买型问题里却输给竞品;在英文 prompt 里出现,在本地化中文 prompt 里消失。测试集要覆盖真实搜索意图,而不是只挑对自己有利的问题。
建议把 prompt 分成 5 组,每组 5-10 个。对小团队来说,第一轮 25-40 个 prompt 已经足够发现主要问题。
| Prompt 组 | 示例 | 主要看什么 |
|---|---|---|
| 定义型 | “What is competitive GEO?”、“什么是 AI search citation?” | AI 是否正确理解品类和概念 |
| 对比型 | “GEO vs AEO”、“Convertos alternatives for AI visibility” | 品牌是否被放进正确比较框架 |
| 购买型 | “best GEO tools for B2B SaaS” | 是否被推荐、是否被引用、价格/限制是否清楚 |
| 问题解决型 | “why is my brand not cited by ChatGPT?” | 页面是否回答具体痛点 |
| 品牌型 | “Convertos.ai AI visibility checker” | 品牌信息是否准确,是否混淆竞品 |
记录时不要只写“出现/未出现”。更有用的字段包括:平台、prompt、日期、答案摘要、品牌是否出现、品牌位置、引用 URL、竞品 URL、错误信息、引用页面类型、下一步修复动作。
如果你要先做内容片段级别的优化,可以用 段落可引用性检测 检查某段定义、价格说明或比较段落是否足够清楚。这个工具适合改局部,但不能替代整页审计。
为什么 AI 引用竞品,却不引用你
当 AI 引用竞品而不是你,先不要把原因归为“模型偏心”。更常见的原因是:竞品页面给了更直接的答案、更完整的事实、更近的更新时间、更容易抽取的比较,或者它本来就在候选来源里靠前。
可以按下面四类差距排查:
| 差距类型 | 典型表现 | 修复动作 |
|---|---|---|
| 相关性差距 | 页面讲的是大主题,不回答具体 prompt | 在首段和对应 H2 直接回答该 prompt |
| 完整性差距 | 缺价格、规格、限制、适用对象 | 增加可比较事实,并说明不确定边界 |
| 证据差距 | 只有营销话术,没有来源或例子 | 给关键 claim 配官方文档、论文、测试、实际例子或案例 |
| 竞争差距 | 竞品有对比页、评测页、第三方引用,你只有官网介绍 | 补比较页,争取第三方页面信息完整一致 |
例如,一个 GEO 工具页面如果只写“帮助你提升 AI 搜索可见度”,它很难赢过一个包含支持平台、监测频率、引用来源展示、导出格式、价格边界和竞品对比的页面。AI 回答要合成可用答案,它会更偏向事实密度高、结论清楚、风险边界明确的来源。
这里还要区分 owned content 和 earned content。你能直接改官网、文档、博客和工具页;但第三方评测、目录页、媒体报道和社区讨论,需要用资料包、产品页、公开价格和清楚的定位去影响。Competitive GEO 不是只改自己的页面,也要看 AI 实际引用了哪些外部页面。
修复优先级怎么排
GEO 修复要按影响面、证据强度、改动成本和可复测性排序。不要每发现一个 prompt 没被引用,就单独改一段文字。优先处理那些会影响多个 prompt 的页面,例如定义页、工具页、比较页、价格页、案例页和第三方目录资料。
我建议用 4 个问题排优先级:
- 这个问题是否影响多个高价值 prompt?
- 这个页面是否已经接近候选来源,只差内容竞争力?
- 修复是否能加入明确事实、证据或比较,而不是只改文风?
- 复测时能不能观察到引用率、提及率或错误率变化?
| 优先级 | 适合先修的情况 | 例子 |
|---|---|---|
| 高 | 影响多个购买、对比、品牌 prompt,且页面已能被搜索到 | 工具页缺价格边界、支持平台和竞品比较 |
| 中 | 页面能回答问题,但证据弱或更新时间旧 | 旧版 GEO 指南没有 2026 年 AI features 和 crawler 信息 |
| 低 | 只影响少数长尾 prompt,或只是格式微调 | 把段落改成更漂亮的列表,但不增加新事实 |
修复时要避免两个极端。一个极端是只做 SEO,不看 AI 答案实际引用了谁;另一个极端是只做“AI 友好格式”,忽略索引、内链、robots 和 snippet 控制。Google 官方文档已经把 AI features 纳入 Search 体系,OpenAI 也把 OAI-SearchBot 与 ChatGPT 搜索展示关联起来。现实做法是两边都查。
如果你的团队已经能稳定收集 AI 回答,可以把 AI 可见性检查器 作为入口,再把高价值 URL 放进 竞品 URL 对标工具 做逐页差距分析。
怎么复测并汇报 Competitive GEO 效果
Competitive GEO 的效果要用同一组 prompt 周期性复测。重点不是承诺“某次更新后必然被引用”,而是观察品牌提及、引用来源、答案准确性、竞品占比和错误信息是否朝正确方向变化。
建议用 30 天作为第一轮观察周期。内容上线后不要当天就下结论,因为搜索抓取、AI 系统更新和答案波动都需要时间。对高价值 prompt,可以每周记录;对长尾 prompt,可以每月记录。
| 指标 | 记录方式 | 解释边界 |
|---|---|---|
| 品牌提及率 | 品牌出现的 prompt 数 / 总 prompt 数 | 提到不等于推荐,也不等于引用 |
| 引用率 | 引用自有 URL 的 prompt 数 / 总 prompt 数 | 不同平台引用展示方式不同 |
| 首引用率 | 自有 URL 成为第一个引用来源的次数 | 更接近论文里的 competitive signal |
| 答案准确率 | 没有事实错误的答案数 / 品牌相关答案数 | 需要人工复核,尤其是价格和功能 |
| 竞品占比 | 竞品被推荐或引用的次数 | 要按 prompt 类型拆开看 |
| 修复响应 | 修复前后同一 prompt 的差异 | 不能只看一次结果,要看多次趋势 |
GEO-16 论文 也支持“用可审计指标看引用行为”的思路。它用 70 个产品意图 prompt 收集 1,702 个引用,并审计 1,100 个 URL,发现 metadata 与 freshness、semantic HTML、structured data 等页面质量信号与引用有关。不过它是观察性研究,且聚焦英文 B2B SaaS 页面,所以更适合当作审计框架参考,而不是通用因果结论。
补充学习可以看 Google Search Central 的 AI features in Search and your site 主题视频。它适合放在团队培训里,帮助非 SEO 同事理解 AI features 仍然和可抓取、可索引、可展示的网页基础相关。公开视频只能补充背景,真正的业务判断仍要回到你自己的 prompt 记录和引用数据。
常见问题
Competitive GEO 是不是取代 SEO?
不是。Competitive GEO 是 SEO 之后的一层引用竞争分析。页面先要能被抓取、索引和检索到,才有机会在 AI 回答里和竞品竞争引用。
问题来源:搜索相关问题和 What Gets Cited 论文标题。
为什么论文说格式影响弱,但很多 GEO 建议都强调结构?
结构仍然有用,因为它帮助读者和机器理解内容;但论文显示,单纯格式变化不如主题匹配、价格、时间戳、规格、证据这些事实类因素稳定。正确做法是用结构承载清楚事实,而不是只改排版。
问题来源:搜索相关问题。
如果我的产品不能公开价格,怎么办?
可以给价格边界、套餐影响因素、试用限制或“适合什么规模团队”的说明。完全没有成本线索时,AI 很难在购买和对比型答案里公平比较你。
问题来源:相关问题和竞品 FAQ。
AI 已经提到我的品牌,但没有引用我的 URL,这算成功吗?
算部分成功,但不是完整成功。品牌提及说明实体可能被识别,URL 引用才说明你的页面成为答案来源之一。报告里要把品牌提及率和引用率分开看。
问题来源:搜索相关问题。
要不要专门加新的 AI schema?
不要为了 AI 回答编不存在的专用 schema。Google 文档明确说,进入 AI Overviews 和 AI Mode 没有额外专用 schema 要求;结构化数据应和可见内容一致。
问题来源:Google Search Central 官方文档和搜索相关问题。
内容声明
本文基于 2026-06-17 前可公开访问的论文、平台官方文档和英文 SERP 样本整理。核心证据来自 What Gets Cited、GEO 原始论文、GEO-16 论文、Google Search Central 和 OpenAI crawler 文档。AI 搜索系统变化很快,文中的审计表和指标适合作为工作方法,不应被理解为任何平台的保证排名或保证引用规则。
发布附录
建议内链
- 在介绍初步检测时链接到 AI 可见性检查器。
- 在讲竞品差距时链接到 竞品 URL 对标工具。
- 在讲单页技术和内容问题时链接到 单页 SEO + GEO 审核。
- 在讲段落改写时链接到 段落可引用性检测。
外部来源
- What Gets Cited: Competitive GEO in AI Answer Engines
- GEO: Generative Engine Optimization
- AI Answer Engine Citation Behavior: GEO-16
- Google Search Central: AI features and your website
- OpenAI crawler documentation
- Google robots meta tag documentation
多媒体配置
- 主视觉:一张说明“检索入口、候选来源、首引用、竞品差距”的原创示意图,文件名
competitive-geo-citation-selection.webp,alt 文案为“AI 回答引擎在候选来源中选择首个引用来源的 Competitive GEO 示意图”。图片应为 webp,首屏使用时控制在 150KB 左右。 - 表格模块:正文已有论文结论表、审计表、prompt 分组表、指标表,可直接转为 WordPress 表格。
- 视频补充:正文已放入 Google Search Central 的 YouTube 学习链接,发布时可保留为普通外链;如果嵌入,需要补 2-4 句文字摘要并懒加载 iframe。
JSON-LD
“json { "@context": "https://schema.org", "@type": "Article", "headline": "AI 回答为什么引用竞品?从 What Gets Cited 看 Competitive GEO", "description": "解读 What Gets Cited 论文:AI 回答引擎为何优先引用某些来源,并给出 Competitive GEO 审计清单、评分表和复测方法。", "dateModified": "2026-06-17", "inLanguage": "zh-CN", "author": { "@type": "Organization", "name": "Convertos.ai" }, "publisher": { "@type": "Organization", "name": "Convertos.ai" } } “
“json { "@context": "https://schema.org", "@type": "FAQPage", "mainEntity": [ { "@type": "Question", "name": "Competitive GEO 是不是取代 SEO?", "acceptedAnswer": { "@type": "Answer", "text": "不是。Competitive GEO 是 SEO 之后的一层引用竞争分析。页面先要能被抓取、索引和检索到,才有机会在 AI 回答里和竞品竞争引用。" } }, { "@type": "Question", "name": "为什么论文说格式影响弱,但很多 GEO 建议都强调结构?", "acceptedAnswer": { "@type": "Answer", "text": "结构仍然有用,因为它帮助读者和机器理解内容;但论文显示,单纯格式变化不如主题匹配、价格、时间戳、规格、证据这些事实类因素稳定。" } }, { "@type": "Question", "name": "要不要专门加新的 AI schema?", "acceptedAnswer": { "@type": "Answer", "text": "不要为了 AI 回答编不存在的专用 schema。Google 文档明确说,进入 AI Overviews 和 AI Mode 没有额外专用 schema 要求;结构化数据应和可见内容一致。" } } ] } “
更新与测量
- 更新周期:每 60-90 天复查一次论文引用、Google AI features 文档、OpenAI crawler 文档和主要 AI 搜索平台展示方式。
- GSC:发布后检查收录、展示、点击、查询增长和 AI/GEO 相关 query。
- GEO:用固定 prompt 记录品牌提及率、引用率、首引用率、竞品占比和答案错误率。
- 内容质量:观察读者是否点击工具页、是否下载或复制审计表、是否从文章进入 URL 对标和 citation check 工具。