Uma base de conhecimento pessoal para aprendizado de Mandarim, construída e mantida por LLMs usando o padrão LLM Wiki.
Este repositório implementa o padrão LLM Wiki aplicado ao aprendizado de Mandarim (foco inicial: HSK1).
Em vez de uma simples coleção de flashcards, é uma base de conhecimento viva:
- 📝 Notas atômicas — uma nota por palavra, com decomposição de radicais, mnemônicas e exemplos
- 🕸️ Grafo interligado — cada nota referencia radicais, conceitos gramaticais e palavras relacionadas
- 🤖 Mantida por LLMs — você traz as fontes e faz perguntas; o agente escreve, atualiza e cross-referencia
- 📈 Composta — a base fica mais rica a cada sessão, sem precisar redescobrir o que já foi aprendido
Conceito base: LLM Wiki Pattern — em vez de RAG (retrieval na hora da query), o LLM constrói e mantém um wiki persistente. O conhecimento é compilado uma vez e fica lá, crescendo.
📁 Chines/ ← Vault do Obsidian
│
├── 📄 AGENTS.md ← Schema do wiki (leia antes de tudo)
├── 📄 Bem-vindo.md ← MOC principal (Map of Content)
├── 📄 index.md ← Índice de todas as páginas
├── 📄 log.md ← Log cronológico append-only
│
├── 📁 wiki/ ← Gerado e mantido pelo LLM
│ ├── 📁 vocab/
│ │ ├── 📁 Lote 0/ ← O Básico (你好, 我, 是)
│ │ ├── 📁 Lote 1/ ← Pronomes e Negação (他, 她, 们, 不)
│ │ ├── 📁 Lote 2/ ← Partículas (吗, 呢, 的, 什么)
│ │ ├── 📁 Lote 3/ ← Identidade (人, 老师, 学生, 中国)
│ │ ├── 📁 Lote 4/ ← Verbos (有, 在, 吃, 去)
│ │ ├── 📁 Lote 5/ ← Números (零到百)
│ │ ├── 📁 Lote 6/ ← Tempo (月, 日, 今天, 明天)
│ │ ├── 📁 Lote 7/ ← Família (妈妈, 爸爸, 朋友)
│ │ ├── 📁 Lote 8/ ← Adjetivos (很, 大, 小, 好)
│ │ └── 📁 Lote 9/ ← Complementar HSK1 + Histórias (62 palavras)
│ ├── 📁 histórias/ ← Textos graduados com análise gramatical
│ ├── 📁 conceitos/ ← Gramática (tons, partículas, SVO...)
│ ├── 📁 radicais/ ← Por radical (女, 人/亻, 口...)
│ └── 📁 sínteses/ ← Análises e comparações geradas
│
└── 📁 fontes/ ← Fontes brutas IMUTÁVEIS
├── 📁 Lote 0-9/ ← Notas originais por lote
├── 📄 Lista HSK1 oficial.md ← Fonte primária da lista
└── 📄 *.md ← Histórias e leituras graduadas (chinesehskreading.com)
| Categoria | Quantidade |
|---|---|
| Notas de vocabulário | 102+ |
| Histórias de leitura | 5 (HSK1) |
| Conceitos gramaticais | 5 (Tons, Partículas, SVO, Negação, Posse) |
| Páginas de radicais | 4 (女, 人/亻, 口, 日) |
| Sínteses temáticas | 3 (Família 电, Partículas, Classificadores) |
| Total de páginas wiki | 110+ |
| Cobertura HSK1 (150 palavras) | ~68% |
Cada nota de vocabulário segue um schema consistente:
---
tags: [hsk1, vocab, verbo]
pinyin: chī
traducao: Comer
hanzi: 吃
dominio: 1
radical_principal: 口
tipo: verbo
criado: 2026-05-02
---
# Comer - 吃 - chī
## 🧩 Decomposição
* [[wiki/radicais/口 - Boca]] (口) + 乞 (implorar)
## 🧠 Conexões Neurais
* **Par**: Beber - 喝 | **Composto**: 吃饭 (fazer refeição)
* **Adjetivo**: 好吃 (delicioso) | **Negação**: 不吃
## 💡 Mnemônica
"A boca (口) que implora (乞) por comida."
## 💬 Contexto (HSK1)
1. **我吃苹果。** — *Wǒ chī píngguǒ.* — Eu como maçã.Além das notas de vocabulário, o wiki compila histórias de leitura graduada com análise integrada:
---
tags: [hsk1, leitura, historia, animais]
titulo_en: I am a cat
fonte: "https://chinesehskreading.com/hsk1/short/i-am-a-cat/"
nivel: HSK1
criado: 2026-05-02
palavras_novas: [猫, 叫, 喜欢, 狗, 再见, 睡觉]
---
# Eu Sou um Gato — 我是一只猫
## 📜 Texto Original
**我叫小猫。** · *Wǒ jiào Xiǎo Māo.* · Meu nome é Xiao Mao.
## 🔑 Vocabulário da História
| Hanzi | Pinyin | Tradução | Link |
|-------|--------|----------|------|
| 猫 | māo | Gato | [[wiki/vocab/Lote 9/Gato - 猫 - māo]] |
## 🧠 Padrões Gramaticais em Destaque
### 1. Classificador 只 para animais
> **我是一只猫。** — Estrutura: 一 + 只 + [animal]
## 💡 Palavras Novas Identificadas
| Palavra | Status |
|---------|--------|
| 睡觉 | ⚠️ Pendente — criar nota vocab |- Obsidian (gratuito)
- Um agente LLM com acesso ao sistema de arquivos:
- Claude Code ✅ (recomendado)
- OpenAI Codex ✅
- Antigravity ✅
- Qualquer LLM com acesso a ferramentas de arquivo
git clone https://github.com/seu-usuario/mandarim-wiki.git- Abra o Obsidian
- "Open folder as vault" → selecione a pasta
Chines/ - Ative o Graph View para ver as conexões
Antes de pedir qualquer coisa ao LLM, compartilhe o arquivo AGENTS.md com ele. Esse arquivo define:
- Estrutura de diretórios
- Formato de cada tipo de página
- Workflows:
ingest,query,lint,evolve - Taxonomia de tags e convenções
"Leia o arquivo AGENTS.md deste repositório antes de qualquer operação."
"Ingest o arquivo fontes/minha-aula-2026-05-10.md seguindo o AGENTS.md"
O LLM vai:
- Ler o arquivo fonte
- Criar/atualizar notas de vocabulário em
wiki/vocab/ - Para histórias: criar página em
wiki/histórias/com texto, vocab e análise gramatical - Verificar e atualizar páginas de radicais em
wiki/radicais/ - Criar sínteses quando padrões relevantes emergirem
- Atualizar
index.md,log.mdeREADME.md
"Quais palavras HSK1 usam o radical 口? Crie uma síntese."
"Compare 不 e 没 — quando usar cada um?"
"Liste todos os verbos de movimento que já aprendi."
Se a resposta for valiosa, peça para salvar:
"Salve esta análise em wiki/sínteses/ e atualize o index.md"
Periodicamente:
"Execute um lint do wiki: procure páginas órfãs, links quebrados,
radicais mencionados sem página própria e frontmatter incompleto."
┌──────────────────────────────────────────────────────────┐
│ VOCÊ (curador) │
│ • Traz fontes (artigos, listas, anotações) │
│ • Faz perguntas e dirige a análise │
│ • Decide o que vale preservar │
└─────────────────────┬────────────────────────────────────┘
│ instrui
▼
┌──────────────────────────────────────────────────────────┐
│ LLM (mantenedor) │
│ • Lê AGENTS.md (schema) │
│ • Consulta index.md (navegação) │
│ • Escreve/atualiza páginas wiki │
│ • Mantém cross-references e log │
└─────────────────────┬────────────────────────────────────┘
│ escreve em
▼
┌──────────────────────────────────────────────────────────┐
│ WIKI (artefato) │
│ • Vocabulário com radicais e mnemônicas │
│ • Conceitos gramaticais interligados │
│ • Sínteses de análises e comparações │
│ • Fica mais rico a cada sessão │
└──────────────────────────────────────────────────────────┘
Este projeto pode ser adaptado para qualquer idioma ou domínio de conhecimento. As peças que precisam mudar:
Edite as seções:
- Estrutura de Diretórios — renomeie
Lote Npara o que fizer sentido (capítulos, temas, níveis...) - Formato de Página — remova campos específicos (pinyin, hanzi) e adicione os relevantes
- Taxonomia de Tags — adapte para o novo domínio
- Contexto do Usuário — atualize idioma, nível e objetivo
Japonês: campos kanji, kana, romaji, jlpt_level
Francês/Espanhol: campos género, conjugação, nível_cef
Programação: campos linguagem, complexidade, caso_de_uso
Medicina: campos sistema, especialidade, mecanismo
Substitua os Lotes por qualquer organização que faça sentido:
- Capítulos de um livro
- Módulos de um curso
- Sprints de estudo
- Temas (cores, família, trabalho...)
| Plugin | Uso |
|---|---|
| Graph View (nativo) | Visualizar conexões entre notas |
| Templates (nativo) | Criar notas de vocab com o schema |
| Dataview | Queries sobre frontmatter (listar por tag, tipo...) |
| Obsidian Web Clipper | Converter artigos da web em Markdown |
- Files & Links → Attachment folder path:
fontes/assets(para imagens) - Graph View → Filters: exclua
index.mdelog.mdpara ver só o conteúdo - Hotkeys: mapeie "Open graph view" para acesso rápido
# Processar uma fonte nova (vocab, lista, aula)
"Ingest fontes/[arquivo.md] seguindo o AGENTS.md"
# Processar histórias de leitura
"Compile os arquivos adicionados em fontes/ para o wiki — são histórias em Mandarim"
# Perguntar algo
"Quais palavras HSK1 pertencem ao radical 人?"
# Salvar resposta valiosa
"Salve esta análise como síntese e registre no log"
# Verificar saúde do wiki
"Execute um lint completo do wiki"
# Adicionar novo lote de vocabulário
"Crie o Lote 10 com as palavras: [lista]"
# Criar conceito gramatical
"Crie uma página de conceito sobre [tópico] em wiki/conceitos/"
# Ver progresso
"Leia o index.md e me dê um resumo do estado atual do wiki"
# [OBRIGATÓRIO após qualquer geração de conteúdo]
"Atualize o README.md com as novas páginas e estatísticas geradas"| Data | Evento | Páginas |
|---|---|---|
| 2026-05-02 | Início do projeto — Lotes 0–8 migrados | 41 notas |
| 2026-05-02 | Compilação completa HSK1 — Lote 9 + radicais + sínteses | +56 notas, +2 sínteses, +3 radicais |
| 2026-05-02 | Histórias de leitura HSK1 (5 textos) + vocab emergente | +5 histórias, +5 notas, +1 síntese |
| 2026-05-05 | Criação de conceitos e radicais pendentes | +4 conceitos, +1 radical |
- LLM Wiki Pattern — o padrão conceitual que este projeto implementa
- Obsidian — o "IDE" do wiki
- HSK Academy — fonte da lista oficial HSK1
- Chinese HSK Reading — histórias de leitura graduada gratuitas
- Vannevar Bush — As We May Think (1945) — a inspiração original para bases de conhecimento pessoais e associativas
MIT — sinta-se livre para clonar, adaptar e usar para o seu próprio aprendizado.
HSK1 em progresso
"A parte tediosa de manter uma base de conhecimento não é a leitura ou o pensamento — é a contabilidade. LLMs não se cansam, não esquecem de atualizar uma referência cruzada."