本系统基于 Compound Engineering(复利工程) 理念设计,核心思想是:
❌ 不要只让 AI 生成一次性结果。 ✅ 要让 AI 帮你生成一套能持续使用、自我增强的系统。
系统采用四步闭环流程,知识层使用 Zettelkasten 笔记法 组织,确保知识可沉淀、可追溯、可复利。
┌──────────┐ ┌──────────┐ ┌──────────┐ ┌──────────┐
│ │ │ │ │ │ │ │
│ 📥 摄取 │ ──▶ │ 🔬 消化 │ ──▶ │ 📤 输出 │ ──▶ │ 🔍 巡检 │
│ Ingest │ │ Digest │ │ Output │ │ Inspect │
│ │ │ │ │ │ │ │
└──────────┘ └──────────┘ └──────────┘ └──────────┘
│ │ │ │
▼ ▼ ▼ ▼
raw/ knowledge/ outputs/ inspection/
(原始材料) (知识结构) (内容产物) (审计报告)
| 步骤 | 动作 | 说明 | 产出 |
|---|---|---|---|
| 📥 1. 摄取 | 标准化 | 把外部输入(网页/推文/论文/播客)统一转为 Markdown | raw/YYYY/MM/ |
| 🔬 2. 消化 | 编译化 | 把原始材料编译为可复用的知识结构 | 摘要 / 概念卡 / 主题页 |
| 📤 3. 输出 | 场景化 | 基于知识系统回答问题或生成内容 | 问答 / 文章 / 备忘录 |
| 🔍 4. 巡检 | 审计化 | 定期检查系统结构性问题,生成报告 | 巡检报告 |
📖 展开详细说明
把外部输入统一转换为标准化 Markdown 文件,存入 raw/。
- ✅ 只做标准化,不做知识加工
- ✅ 保留原文、保留元信息(来源/时间/作者)
- 📄 参考:
prompts/ingest.md+schemas/raw-schema.md
把原始材料编译为可复用的知识结构,存入 knowledge/。
- 生成摘要 →
knowledge/literature/ - 抽取概念 →
knowledge/permanent/concepts/ - 创建主题页 →
knowledge/permanent/topics/ - 更新索引 →
knowledge/index/ - 📄 参考:
prompts/digest.md+ 对应 schema
基于知识系统回答问题或生成内容,存入 outputs/。
- 先检索,再综合,再生成
- 输出既是消费,也是再生产
- 📄 参考:
prompts/output.md
定期审计系统结构性问题,生成报告存入 inspection/。
- 检查冲突、重复、孤岛、断链、过时、缺来源
- 只出报告,不自动修复
- 📄 参考:
prompts/inspect.md+schemas/inspection-schema.md
knowledge-system/
├── AGENTS.md # 系统规则(AI Agent 行为规范)
├── README.md # 本文件
│
├── raw/ # 📥 摄取层:原始材料池
│ └── YYYY/MM/ # 按年月组织
│
├── knowledge/ # 🔬 知识层(Zettelkasten)
│ ├── fleeting/ # 💭 临时想法
│ ├── literature/ # 📚 阅读笔记与摘要
│ ├── permanent/
│ │ ├── concepts/ # 💎 概念卡(原子化)
│ │ └── topics/ # 🗺️ 主题页(综合深度)
│ └── index/ # 📋 索引、导航页、MOC
│
├── outputs/ # 📤 输出层
│ ├── qa/ # ❓ 问答归档
│ ├── article/ # ✍️ 图文长文
│ ├── memo/ # 📝 研究备忘录
│ └── social/ # 📢 海报与 thread
│
├── inspection/ # 🔍 巡检报告
├── prompts/ # 📋 提示词模板库
├── schemas/ # 📐 Schema 模板库
└── tools/ # 🛠️ Python CLI 工具
想尽快跑通?只需 4 步:
# ① 摄取一篇文章和一条推文,存到 raw/
# ② 让 AI 对这两个 raw 文件执行一次消化
# ③ 让 AI 回答一个具体问题,把回答存到 outputs/qa/
# ④ 让 AI 对 knowledge/ 做一次巡检,生成报告跑通这一轮,系统雏形就有了。先跑通最小闭环,再慢慢增强。
推荐用于日常浏览和知识管理
- 用 Obsidian 打开
knowledge-system/文件夹 - 通过文件浏览器浏览
raw/knowledge/outputs/ - 利用双向链接
[[]]在知识条目间跳转 - 使用反向链接面板查看引用关系
推荐用于批量处理和知识加工
- 让 AI 先阅读
AGENTS.md了解系统规则 - 根据任务选择对应步骤的提示词(
prompts/) - 按对应 schema(
schemas/)输出标准化文件 - 遵循增量更新原则,不全量重建
推荐用于自动化和程序化调用
# 检查 Obsidian 连接
python tools/ks.py health
# 搜索知识库
python tools/ks.py search "关键词"
# 摄取新资料
python tools/ks.py ingest --title "标题" --content "正文"
# 更多命令见 MANUAL.md本系统的设计灵感来自以下两个核心来源:
Karpathy 在 X/Twitter 上分享了用 LLM 构建个人知识库的完整工作流(阅读量超 1900 万)。核心思路:
用 LLM 将原始数据"编译"为 .md wiki,再通过 CLI 工具进行问答和增量增强,全部在 Obsidian 中查看。你几乎不需要手动编辑 wiki,那是 LLM 的领域。
他的流程 Data Ingest → Wiki Compile → Q&A → Output → Linting,与本系统的摄取 → 消化 → 输出 → 巡检高度一致。
Samuel 在 飞书文档 中系统化地提出了 Compound Engineering(复利工程) 理念,并将 Karpathy 的工作流扩展为可复现的四步流程。核心思想:
不要只让 AI 生成一次性的结果。要让 AI 帮你生成一套能持续使用、自我增强的系统。
本系统直接基于 Samuel 的方法论构建,采用 Zettelkasten 笔记法组织知识层,并集成了 Obsidian + AI Agent 工具链。
| 来源 | 作者 | 链接 |
|---|---|---|
| LLM Knowledge Bases | Andrej Karpathy | 🔗 X/Twitter |
| 用 AI 搭一套会复利的知识系统 | 数字游牧人 Samuel | 🔗 飞书文档 |
让每一次处理,都不是结束,而是下一次处理的输入。