让网站更“懂”AI:聊聊 llms.txt 与 WordPress LLMS插件下载
资源名称:【22474】wp-llms-txt.0.9.0.zip
资源大小:6KB
更新日期:2025-12-02
防骗提醒:请勿相信资源内营销广告,谨防被骗!
6KB 0 人已下载 手机查看
最近在逛 Apifox 的接口文档时,无意间发现了一个叫 llms.txt 的小文件。出于技术人的好奇心,我顺藤摸瓜研究了一番——这玩意儿说白了,就是给大模型(LLM)看的“网站说明书”。为了让自己的博客也能被 AI 更友好地理解,我试了好几个现成的 WordPress 插件,结果都不太满意:格式乱、结构散,完全没按社区推荐规范来。一气之下,干脆自己撸了个插件,今天就和大家唠唠这个过程(来自威言威语博主)。
一、llms.txt 是啥?和 robots.txt、sitemap.xml 有啥区别?
很多老站长都熟悉 robots.txt 和 sitemap.xml,它们分别是给搜索引擎爬虫用的“禁区地图”和“内容索引表”。而新冒出来的 llms.txt,目标用户不是搜索引擎,而是大型语言模型(如你正在用的我)。
| 文件名 | 目标对象 | 主要作用 |
|---|---|---|
robots.txt |
搜索引擎爬虫 | 控制哪些路径可以/不可以被抓取 |
sitemap.xml |
搜索引擎爬虫 | 提供全站 URL 列表,加速收录 |
llms.txt |
AI / 大语言模型工具 | 提供结构化语义信息,帮助 AI 快速理解网站内容 |
简单说,llms.txt 就像是你给 AI 递的一张“名片+目录”,告诉它:“嘿,这是我的网站,重点在这几块,别瞎猜了。”
二、社区规范长啥样?别乱写!
虽然 llms.txt 目前还是个社区提案(尚未成为官方标准),但已经有比较清晰的格式建议了。参考 llms-txt 社区文档,一个合规的 llms.txt 应该长这样:
# 网站名称
> 这里是一段简短的项目摘要,用引用块(blockquote)形式呈现,包含理解全文的关键信息。
可以在这里加一些补充说明,比如网站定位、核心内容等,但不能用标题(#)。
## 核心页面
- [关于我们](https://example.com/about): 介绍团队背景与使命
- [技术博客](https://example.com/blog): 分享开发经验与行业观察
## API 文档
- [用户接口](https://docs.example.com/user-api)
- [支付接口](https://docs.example.com/payment-api): 支持微信、支付宝等多种方式
关键规则总结:
- 只能有一个 H1 标题(即
#开头的那一行) - 摘要必须用
>引用块 - 后续可用多个 H2(
##)分组 - 每个链接项格式为
[名称](URL): 可选说明
💡 很多插件犯的错误就是乱用多个
#,或者把摘要写成普通段落——这会让 AI 解析时“懵圈”。
三、为啥我不用现成插件?自己造轮子更香
我在 WordPress 插件市场试了不下十个号称支持 llms.txt 的插件,结果要么格式错乱,要么信息缺失。比如有的直接把所有文章标题堆成一坨,连分类都没有;有的甚至生成 HTML 而不是纯 Markdown。
既然需求明确、逻辑简单,不如自己写一个!我的目标很清晰:
- 严格遵循社区规范
- 自动提取页面、文章、分类、标签的摘要或描述
- 允许手动补充页面摘要(WordPress 默认不开放页面的
post_excerpt字段)
于是,我开发了 WP LLMs.txt 插件。
✅ 小技巧:WordPress 的“页面”其实也有摘要字段(
post_excerpt),只是后台默认不显示。我在插件里加了个钩子,让它在编辑页面时出现,方便填写。
四、插件怎么用?配置要注意啥?
1. 安装与使用
- 下载插件:WP LLMs.txt(提取码:
llms) - 启用后,访问
https://your-site.com/llms.txt即可看到自动生成的文件
2. 非根目录安装?记得做 URL 重写!
如果你的 WordPress 装在 /blog 这类子目录下(比如我),直接访问根目录的 llms.txt 会 404。这时候需要服务器配置转发。
Nginx 配置示例:
location = /llms.txt {
rewrite ^ /blog/llms.txt last;
}
Apache(.htaccess)配置示例:
RewriteEngine On
RewriteRule ^llms\.txt$ /blog/llms.txt [L]
🔧 这两段代码千万别改!原样复制就行,前面加了注释方便你理解用途。
五、要不要上 llms-full.txt?先别急
除了 llms.txt,社区还提到了 llms-full.txt——它包含全站所有页面的完整 Markdown 内容。听起来很酷,但实际问题不少:
- 文件体积爆炸(尤其文章多的站)
- 更新成本高
- 大多数 AI 并不需要全文,只需要结构化指引
像 Apifox 就做得聪明:他们的 llms.txt 里每个链接指向的是单独的 Markdown 文件(比如 /docs/api.md),而不是把所有内容塞进一个文件。这种“按需加载”模式更合理。
所以我暂时没做 llms-full.txt 支持,聚焦把基础版做好。
六、验证你的 llms.txt 是否合规
写完别急着上线!用官方验证工具检查一下:
🔗 https://llmstxtvalidator.org
它会告诉你是否符合社区规范,比如 H1 是否唯一、摘要是否用引用块等。
另外,你也可以去这个站点看看别人是怎么写的:
🌐 https://llmstxt.sitedirectory.llmstxt.cloud
七、值不值得加?我的看法
说实话,现在加 llms.txt 更像是“技术尝鲜”。毕竟主流 AI 已经能很好地抓取和理解网页内容,不一定非靠这个文件。
但换个角度想:
- 如果你希望 AI 精准理解你的网站结构(比如文档站、知识库)
- 或者你想让未来的 AI 工具优先采用你的结构化数据
- 又或者你就是个喜欢折腾的技术控 😎
那花半小时配一下,完全值得。至少,你的网站在 AI 眼里会显得“更专业、更有条理”。
结语:跟上 AI 浪潮,从一个小文件开始
llms.txt 虽小,却是网站与 AI 对话的新桥梁。与其等标准落地再跟进,不如现在就动手试试。我自己写插件的过程也挺有意思——需求驱动、快速验证、解决痛点,典型的程序员思维。
如果你也在用 WordPress,欢迎试试我的插件(提取码 llms),有问题评论区见!也欢迎一起讨论:你觉得 llms.txt 未来会成为标配吗?
🧠 最后吐槽一句:有些网友说“不能自己爬完的 AI 不是好 AI”——这话没错,但如果有份清晰的说明书,何乐而不为呢?毕竟,好的设计,就是让机器少猜,让人多赢。
![点击查看[1]](https://www.uonce.com/wp-content/uploads/2025/11/doubao.png)
![点击查看[2]](https://www.uonce.com/wp-content/uploads/2025/11/huiwa.jpg)
![点击查看[3]](https://www.uonce.com/wp-content/uploads/2025/11/xiaohuanxiongad.png)



