Verwijder persoonsgegevens en organisatiespecifieke informatie uit documenten — interactief, transparant, EU-soeverein.
👉 Iets delen, feedback geven of een vraag stellen? Klik op een van de knoppen hierboven — geen Git-ervaring nodig. Zie CONTRIBUTING.md voor meer opties.
Gebouwd zodat CISO's en ISO's interne kennis kunnen delen via de kennisbank zonder privacyrisico's.
Nieuw hier? Lees de handleiding — stap-voor-stap gids met voorbeelden, redactionele keuzes en troubleshooting.
Je geeft een document op (PDF, Word, PowerPoint, Excel, Markdown, HTML). De tool:
- Haalt de tekst eruit en verwijdert afbeeldingen
- Past automatisch bekende vervangingen toe (bijv. jouw gemeentenaam →
VOORBEELDGEMEENTE) - Laat je per nieuw gevonden naam, e-mailadres of interne term zelf kiezen wat ermee gebeurt
- Onthoudt jouw keuzes voor de volgende keer
- Slaat het resultaat op als
.mdén.html
- Python 3.11 of nieuwer — python.org/downloads
- Git — git-scm.com
git clone https://github.com/security-commons-nl/anonimizer.git
cd anonimizer
pip install -r requirements.txtDe tool gebruikt een taalmodel (Mistral) om namen en organisaties te herkennen. Je hebt hiervoor een gratis account nodig:
- Ga naar console.mistral.ai
- Maak een account aan
- Ga naar API Keys en klik Create new key
- Kopieer de sleutel
cp .env.example .envOpen .env in een teksteditor en vul je sleutel in:
AI_API_KEY=jouw-sleutel-hier
cp standaard.yaml.example standaard.yamlOpen standaard.yaml en pas de namen aan voor jouw organisatie. Alles wat hier staat wordt automatisch vervangen zonder dat je er per keer naar gevraagd wordt.
# Eén document
python anonimizer.py verwerk document.pdf
# Word-bestand
python anonimizer.py verwerk beleid.docx
# Hele map
python anonimizer.py verwerk map/ --batch
# Met opgegeven uitvoernaam
python anonimizer.py verwerk document.pdf --output schoon.md| Formaat | Extensie |
|---|---|
.pdf |
|
| Word | .docx |
| PowerPoint | .pptx |
| Excel | .xlsx |
| Markdown | .md |
| Platte tekst | .txt |
| HTML | .html, .htm |
Per nieuw gevonden element kies je wat er mee gebeurt:
[1/8] Persoon: "Jan de Vries"
Suggestie: "de CISO"
> (Enter = akkoord, eigen tekst = jouw vervanging, s = overslaan, q = stop)
Bevestigde keuzes worden onthouden in memory.json. De volgende keer dat je een document verwerkt worden ze automatisch toegepast.
| Variabele | Standaard | Beschrijving |
|---|---|---|
AI_API_BASE |
https://api.mistral.ai/v1 |
LLM API-endpoint |
AI_API_KEY |
— | API-sleutel (verplicht) |
AI_MODEL_NAME |
mistral-small-latest |
Taalmodel |
Volledig lokaal draaien via Ollama: stel AI_API_BASE=http://localhost:11434/v1 en AI_API_KEY=ollama in.
Vervangingen die je hier opneemt worden zonder prompt toegepast op elk document. Zie standaard.yaml.example voor een startpunt met gangbare gemeente- en regionamen.
Wordt automatisch aangemaakt. Bevat alle eerder bevestigde vervangingen. Niet in git — lokaal per gebruiker.
- Handleiding — stap-voor-stap gids voor CISO's en ISO's
- Concept en ontwerp
- Bijdragen
Dit project volgt de architectuur- en communityprincipes van security-commons-nl: EU-soevereiniteit, AI altijd adviserend, auditbaarheid by design, least privilege en open source als standaard.