Skip to content

AIKB 对照 LLM Wiki 理念的实现差距与优化建议

问题

当前 AI 知识库(aikb)是否已经完全按照 Karpathy LLM Wiki 理念实现?还有什么可以优化?是否 Query 层还没做,即优质回答归档回 wiki 作为新页面?

简短答案

  • 整体已经实现了 70%–80% 的 LLM Wiki 理念
  • 最大缺口是 Query 层尚未落地,即“高质量问答沉淀回 wiki ”的闭环还没有形成
  • 建议立即补充 Query 归档机制,并同步修复 frontmatter 不完整、维护日志发布边界等问题

已经实现得比较好的部分

1. 三层架构基本到位

当前结构已经符合 LLM Wiki 的核心分层思想:

  • raw/ — 原始资料层,不直接改写
  • wiki/ — 可发布的知识页面层
  • schema/ — 规范、日志、维护规则层

关键组件都已存在:SCHEMA.mdschema/log.mdraw/ 目录。

2. Wiki 页面层已经比较丰富

当前正文页面统计:

分类页数
实体48
概念54
比较29
指南3
趋势5
资源4
合计143

这说明知识库已经从早期 seed wiki 进入比较完整的领域知识库阶段。

  • 所有页面都已在左侧导航中出现
  • 大部分页面已在首页或分类索引中出现
  • wikilinks 插件支持内部链接,raw 层链接会被渲染为纯文本

4. raw 层有 hash,已经具备来源不可变的基础

扫描结果:24 个 raw 文件全部带有 sha256 frontmatter。这说明 raw 层不是随手粘贴,而是有版本控制意识,后续可以做 source drift 检测。

5. schema 已经定义了 Query Page 的原则

schema/SCHEMA.md 中已有:

当一次查询产出具有复用价值的深度总结、路线图、专题分析时,应归档到 wiki/queries/ 。 普通问答不必落库。


主要缺口

1. Query 层还没有真正实现(最大缺口)

当前状态:

  • wiki/queries/ 目录存在
  • 实际 Query 页面数量:0
  • 首页没有 Query 区块
  • 左侧导航没有 Query 区块
  • wikilinks 没有 Query 页面注册
  • 没有形成“回答问题 → 判断是否值得归档 → 写入 query 页面 → 反向链接到实体/概念/比较页”的工作流

当前知识库的流程是:

ingest / create / update / publish

但还没有形成:

query / answer / synthesize / archive back to wiki

而 LLM Wiki 的一个关键价值恰恰是:让高质量回答变成下一次可复用的知识资产。

2. 部分页面 frontmatter 不完整

审计发现:

缺失字段页数
created25
updated25
type25
tags31
sources87

早期页面和后续批量页面的元数据规范不完全一致。这会影响后续自动 lint、Query 归档、内容新旧判断、来源追踪。

3. 维护日志和发布边界混乱

当前有两个 log 文件:

  • schema/log.md — 正式维护日志(不发布)
  • wiki/schema/log.md — 已经被发布到 dist/schema/log.html

按照 schema 设计,schema/ 层不应该发布。这个文件误发布了。

4. 部分页面超过 200 行

有 23 个页面超过 200 行,最大的几个:

页面行数
guides/ai-agent-guide.md496
guides/llm-wiki-guide.md494
guides/rag-system-guide.md445
concepts/harness-engineering.md369
concepts/diffusion-models.md296

指南页保留长文没问题,但概念页和比较页超过 250 行时,可以考虑拆分为主页面 + 子页面。

5. 分类索引和首页不是 100% 完整

有 16 个页面没有在首页 wiki/index.md 中直接出现,例如:

  • concepts/harness-engineering-evaluation.md
  • concepts/agent-skills/*
  • comparisons/multimodal-models-comparison.md
  • comparisons/coding-llm-comparison.md
  • comparisons/llm-vs-world-models.md

不过左侧导航已经全覆盖,所以不是严重问题。


优化建议

第一优先级:补 Query 归档机制

这是最符合当前判断的优化。要做的事情:

  1. 新增 wiki/queries/index.md
  2. 在 VitePress nav/sidebar 中加入 Query Archives
  3. 在首页加入 Query Archives 区块
  4. 在 wikilinks 插件中支持 query 页面
  5. 把本次分析归档为第一篇 query 页面
  6. 更新 schema,明确 Query 归档标准和流程
  7. 构建部署验证

第二优先级:做 metadata lint 修复

统一补齐:

  • created
  • updated
  • type
  • tags
  • sources
  • confidence

尤其是 sourcesconfidence,对知识库可信度很重要。

第三优先级:完善维护日志和发布边界

处理:

  • wiki/schema/log.md 误发布 → 删除
  • schema/log.md 迁移到 wiki/log.md 作为公开 changelog
  • 后续所有维护记录只写 wiki/log.md
  • VitePress 不发布 schema/ 内容

第四优先级:建立自动 lint 脚本

新增 scripts/wiki-lint.py,检查:

  • frontmatter 完整性
  • index / sidebar / wikilinks 覆盖
  • broken wikilinks
  • raw hash drift
  • 页面长度
  • 内链数量
  • query 是否登记

后续每次更新前后都跑一次。


相关页面


本页面创建于 2026-04-28,是 AIKB 的第一篇 Query 归档页面。

AI Knowledge Base — 持续积累