Appearance
AIKB 对照 LLM Wiki 理念的实现差距与优化建议
问题
当前 AI 知识库(aikb)是否已经完全按照 Karpathy LLM Wiki 理念实现?还有什么可以优化?是否 Query 层还没做,即优质回答归档回 wiki 作为新页面?
简短答案
- 整体已经实现了 70%–80% 的 LLM Wiki 理念
- 最大缺口是 Query 层尚未落地,即“高质量问答沉淀回 wiki ”的闭环还没有形成
- 建议立即补充 Query 归档机制,并同步修复 frontmatter 不完整、维护日志发布边界等问题
已经实现得比较好的部分
1. 三层架构基本到位
当前结构已经符合 LLM Wiki 的核心分层思想:
raw/— 原始资料层,不直接改写wiki/— 可发布的知识页面层schema/— 规范、日志、维护规则层
关键组件都已存在:SCHEMA.md、schema/log.md、raw/ 目录。
2. Wiki 页面层已经比较丰富
当前正文页面统计:
| 分类 | 页数 |
|---|---|
| 实体 | 48 |
| 概念 | 54 |
| 比较 | 29 |
| 指南 | 3 |
| 趋势 | 5 |
| 资源 | 4 |
| 合计 | 143 |
这说明知识库已经从早期 seed wiki 进入比较完整的领域知识库阶段。
3. 首页索引、左侧导航、wikilink 体系基本可用
- 所有页面都已在左侧导航中出现
- 大部分页面已在首页或分类索引中出现
wikilinks插件支持内部链接,raw 层链接会被渲染为纯文本
4. raw 层有 hash,已经具备来源不可变的基础
扫描结果:24 个 raw 文件全部带有 sha256 frontmatter。这说明 raw 层不是随手粘贴,而是有版本控制意识,后续可以做 source drift 检测。
5. schema 已经定义了 Query Page 的原则
schema/SCHEMA.md 中已有:
当一次查询产出具有复用价值的深度总结、路线图、专题分析时,应归档到
wiki/queries/。 普通问答不必落库。
主要缺口
1. Query 层还没有真正实现(最大缺口)
当前状态:
wiki/queries/目录存在- 实际 Query 页面数量:0
- 首页没有 Query 区块
- 左侧导航没有 Query 区块
- wikilinks 没有 Query 页面注册
- 没有形成“回答问题 → 判断是否值得归档 → 写入 query 页面 → 反向链接到实体/概念/比较页”的工作流
当前知识库的流程是:
ingest / create / update / publish但还没有形成:
query / answer / synthesize / archive back to wiki而 LLM Wiki 的一个关键价值恰恰是:让高质量回答变成下一次可复用的知识资产。
2. 部分页面 frontmatter 不完整
审计发现:
| 缺失字段 | 页数 |
|---|---|
created | 25 |
updated | 25 |
type | 25 |
tags | 31 |
sources | 87 |
早期页面和后续批量页面的元数据规范不完全一致。这会影响后续自动 lint、Query 归档、内容新旧判断、来源追踪。
3. 维护日志和发布边界混乱
当前有两个 log 文件:
schema/log.md— 正式维护日志(不发布)wiki/schema/log.md— 已经被发布到dist/schema/log.html
按照 schema 设计,schema/ 层不应该发布。这个文件误发布了。
4. 部分页面超过 200 行
有 23 个页面超过 200 行,最大的几个:
| 页面 | 行数 |
|---|---|
guides/ai-agent-guide.md | 496 |
guides/llm-wiki-guide.md | 494 |
guides/rag-system-guide.md | 445 |
concepts/harness-engineering.md | 369 |
concepts/diffusion-models.md | 296 |
指南页保留长文没问题,但概念页和比较页超过 250 行时,可以考虑拆分为主页面 + 子页面。
5. 分类索引和首页不是 100% 完整
有 16 个页面没有在首页 wiki/index.md 中直接出现,例如:
concepts/harness-engineering-evaluation.mdconcepts/agent-skills/*comparisons/multimodal-models-comparison.mdcomparisons/coding-llm-comparison.mdcomparisons/llm-vs-world-models.md
不过左侧导航已经全覆盖,所以不是严重问题。
优化建议
第一优先级:补 Query 归档机制
这是最符合当前判断的优化。要做的事情:
- 新增
wiki/queries/index.md - 在 VitePress nav/sidebar 中加入 Query Archives
- 在首页加入 Query Archives 区块
- 在 wikilinks 插件中支持 query 页面
- 把本次分析归档为第一篇 query 页面
- 更新 schema,明确 Query 归档标准和流程
- 构建部署验证
第二优先级:做 metadata lint 修复
统一补齐:
createdupdatedtypetagssourcesconfidence
尤其是 sources 和 confidence,对知识库可信度很重要。
第三优先级:完善维护日志和发布边界
处理:
wiki/schema/log.md误发布 → 删除schema/log.md迁移到wiki/log.md作为公开 changelog- 后续所有维护记录只写
wiki/log.md - VitePress 不发布
schema/内容
第四优先级:建立自动 lint 脚本
新增 scripts/wiki-lint.py,检查:
- frontmatter 完整性
- index / sidebar / wikilinks 覆盖
- broken wikilinks
- raw hash drift
- 页面长度
- 内链数量
- query 是否登记
后续每次更新前后都跑一次。
相关页面
- LLM Wiki — LLM Wiki 知识库模式概念页
- AI Agent 开发入门指南 — AI Agent 开发与框架选型指南
- Agent 框架对比 — Agent 框架横向对比
- 2026 年 AI 趋势速览 — 2026 年 AI 趋势速览
本页面创建于 2026-04-28,是 AIKB 的第一篇 Query 归档页面。