跳转到内容

LLMO快速入门:30分钟实施指南

只需三个文件,30分钟内即可让你的网站对AI可发现。本指南介绍LLMO的最小可行实施方案。

文件用途耗时
robots.txt允许AI爬虫访问你的网站5分钟
llms.txt为AI提供你网站的结构化摘要15分钟
JSON-LD <script>为AI提供关于你内容的结构化数据10分钟

第1步:为AI爬虫配置robots.txt(5分钟)

Section titled “第1步:为AI爬虫配置robots.txt(5分钟)”

大多数网站已经有 robots.txt。为AI爬虫添加明确的 Allow 规则:

User-agent: *
Allow: /
User-agent: GPTBot
Allow: /
User-agent: ClaudeBot
Allow: /
User-agent: Google-Extended
Allow: /
User-agent: PerplexityBot
Allow: /
Sitemap: https://yoursite.com/sitemap.xml

为什么需要明确的Allow规则? 一些托管平台和CDN默认会屏蔽AI爬虫。明确的规则可以防止意外屏蔽。

爬虫运营方用途
GPTBotOpenAIChatGPT、网页浏览
ClaudeBotAnthropicClaude网页搜索
Google-ExtendedGoogleGemini、AI Overviews
PerplexityBotPerplexityPerplexity搜索
AmazonbotAmazonAlexa、商品搜索
CCBotCommon Crawl训练数据收集

llms.txt 文件(由Jeremy Howard在 llmstxt.org 提出)为AI系统提供你网站的结构化摘要。

将此文件放置在网站根目录:https://yoursite.com/llms.txt

# 你的网站名称
> 用一句话描述你的网站做什么。
## 我们做什么
简要说明你的核心业务、专业领域或目标。
使用通俗语言,避免营销术语。
## 关键信息
- 成立时间:[年份]
- 团队规模:[人数或核心成员]
- 所在地:[如相关]
- 专业方向:[核心专长]
## 产品/服务
- **产品A**:简要描述
- **产品B**:简要描述
## 链接
- 官网:https://yoursite.com
- 文档:https://yoursite.com/docs
- GitHub:https://github.com/yourorg
- 联系方式:https://yoursite.com/contact
  1. 以事实开头,而非营销话术。 “我们使用AI自动化构建Android应用”比”我们利用前沿协同效应”更有效。
  2. 包含结构化数据。 表格、列表和键值对比长段落文字更容易被AI解析。
  3. 控制在2,000词以内。 简洁的摘要更有可能被完整读取。
  4. 定期更新。 AI系统会周期性地重新抓取。过时的llms.txt意味着过时的AI回答。

第3步:JSON-LD结构化数据(10分钟)

Section titled “第3步:JSON-LD结构化数据(10分钟)”

在首页的 <head> 中添加JSON-LD脚本。这有助于AI理解你的实体类型、关联关系和关键属性。

<script type="application/ld+json">
{
"@context": "https://schema.org",
"@type": "Organization",
"name": "Your Company",
"url": "https://yoursite.com",
"description": "What your company does in one sentence.",
"founder": {
"@type": "Person",
"name": "Founder Name"
},
"sameAs": [
"https://github.com/yourorg",
"https://linkedin.com/company/yourorg",
"https://x.com/yourorg"
]
}
</script>
<script type="application/ld+json">
{
"@context": "https://schema.org",
"@type": "Article",
"headline": "Your Article Title",
"author": {
"@type": "Person",
"name": "Author Name",
"url": "https://authorsite.com"
},
"datePublished": "2026-01-15",
"publisher": {
"@type": "Organization",
"name": "Your Company"
}
}
</script>
内容类型Schema优先级
首页Organization 或 Person
博客文章Article 或 BlogPosting
产品Product
FAQ页面FAQPage
技术文档TechArticle
书籍Book

部署后,检查以下几项:

  1. robots.txt:访问 https://yoursite.com/robots.txt,确认AI爬虫已被允许
  2. llms.txt:访问 https://yoursite.com/llms.txt,验证内容准确无误
  3. JSON-LD:使用 Google Rich Results测试工具 或查看页面源码确认script标签存在
  4. AI测试:向ChatGPT或Perplexity询问关于你网站/产品的问题,观察回答结果

本快速入门涵盖了LLMO Framework的 Retrieval SignalsStructural Formatting 组件。要了解完整框架: