OpenClaw Gedächtnissystem erklärt: KI-Erinnerungen in Markdown-Dateien
Letzte Woche ließ ich die KI eine Architektur analysieren – im Chatverlauf war alles längst weg. KI-Assistenten lösen Probleme, vergessen aber schnell: Nach dem Gespräch ist fast alles weg. Und wo landen die Dialogdaten? Auf Cloud-Servern? Wer kann sie sehen?
OpenClaw speichert alle KI-Erinnerungen in Markdown-Dateien auf Ihrer lokalen Festplatte. Das löst zwei Probleme: Die KI behält Langzeitgedächtnis, und die Daten werden nicht in die Cloud hochgeladen.
Dieser Artikel erklärt OpenClaws Gedächtnissystem: Zweischicht-Architektur (temporäre Logs + persistentes Wissen), Hybrid-Retrieval (BM25 + Vektor-Semantik) und lokaler Datenschutz. Daten bleiben unter Ihrer Kontrolle – jederzeit in VSCode bearbeitbar, mit Git versionierbar.
Günstiger Einstieg: ArkClaw macht KI-Agenten zugänglich
OpenClaw (der „Hummer“) ist beliebt, aber die Einrichtung schreckt ab? ByteDance Volcano Engine bietet ArkClaw mit minimaler Hürde: ohne Server- und Token-Gefummel einen 24/7-Agenten mit Browser, Skripten und Kalender.
Preis: 9,9 Yuan/Monat; mit Einladungscode ZLKUK54M (hier registrieren) 8,9 Yuan. Entwickler: Coding Plan Pro kann kostenlos nutzbar sein.
Warum Markdown: File-first als Designphilosophie
Beim ersten Anblick war ich skeptisch: Markdown für Dokumente – und plötzlich als KI-Datenbank?
Bei näherer Betrachtung ist das Design schlau.
Liegen alle Erinnerungen in PostgreSQL, brauchen Sie einen DB-Client und SQL, nur um zu sehen, was die KI gespeichert hat. Bei Markdown? VSCode öffnen – fertig. Ändern? Speichern. Backup? Ordner kopieren. Stand von letzter Woche? Ein Git-Befehl.
OpenClaw nennt das „File-first“. Markdown ist die „Single Source of Truth“; die Datenbank dient nur Indexierung und schneller Suche.
Das erinnert an Anthropics NOTES.md-Empfehlung: Entwickler legen NOTES.md an, dokumentieren Entscheidungen und Kontext – die KI liest bei jedem Start mit. OpenClaw treibt das weiter: nicht eine Datei, sondern das gesamte Gedächtnissystem auf Markdown.
Vergleich mit klassischen Ansätzen:
- Redis/In-Memory: Schnell, aber nach Neustart weg – extra Persistenz nötig
- PostgreSQL/MySQL: Mächtig, aber schwer, wartungsintensiv, Daten wenig transparent
- Vektordatenbank (z. B. Pinecone): Für KI gemacht, oft Cloud – Daten verlassen den Rechner
Vorteile von Markdown:
- Lesbar: Sie sehen jederzeit, was die KI „weiß“
- Kontrolle: Daten auf Ihrer Platte – Backup, Löschen, Verschlüsselung nach Belieben
- Git-tauglich: Versionshistorie, sogar Teamarbeit
- Keine Abhängigkeiten: Kein DB-Dienst, kein Docker-Zwang, keine Cloud
Schwäche: Retrieval bei vielen Textdateien – dazu gleich mehr.
Zweischicht-Gedächtnis: Temporär und persistent im Gleichgewicht
OpenClaws Gedächtnis ähnelt dem menschlichen: Kurz- und Langzeitgedächtnis – bei OpenClaw Daily Logs und Curated Knowledge.
Temporäre Logs sind wie Kurzzeitgedächtnis: Heutige Aktivitäten landen in memory/YYYY-MM-DD.md. Am 5. Februar 2026 entsteht memory/2026-02-05.md, Append-only.
Clever: OpenClaw lädt automatisch heutige und gestrige Logs. Zwei Tage halten den Kontext frisch – gestern Besprochenes ist heute noch da. Ältere Logs werden nicht automatisch geladen, sonst explodiert das Kontextfenster.
Persistentes Wissen liegt im MEMORY-Ordner – manuell oder automatisch extrahierte wichtige Infos: Architektur, Entscheidungen, Code-Snippets.
Strukturbeispiel:
memory/
├── 2026-02-01.md # Alt, nicht auto-geladen
├── 2026-02-04.md # Gestern, auto-geladen
├── 2026-02-05.md # Heute, auto-geladen
└── MEMORY/
├── project-architecture.md # Persistent, bei Bedarf per Suche
├── deployment-notes.md
└── troubleshooting-guide.md
Beim Start liest die KI die letzten zwei Tage in den Kontext – nahtlose Fortsetzung unterbrochener Themen. Infos von vor einem Monat finden Sie per Retrieval im MEMORY-Ordner.
Praktisch: Auto-Archivierung. Bei vielen Logs triggert OpenClaw Flush – Komprimierung oder Archiv, damit die Platte nicht voll läuft. Wichtiges wandert in persistenten Speicher.
Das erinnert an die Vergessenskurve: Nicht alles muss ewig bleiben; Wichtiges sinkt ins Langzeitgedächtnis.
Effizientes Retrieval: SQLite und Hybrid-Suche
Problem: Hunderte Markdown-Dateien – wie findet man schnell Relevantes?
Grep allein reicht nicht. Sie suchen „Container-Deployment“, die Notiz heißt „Docker-Image-Build und K8s-Deployment“ – kein Stichwort-Treffer. Reine Textsuche versteht keine Semantik.
OpenClaws Antwort: Hybrid-Retrieval – BM25 (Stichwörter) plus Vektor-Ähnlichkeit.
So funktioniert es:
-
Index-Schicht: SQLite. Beim Schreiben werden Inhalte in Chunks geteilt:
- FTS5 für Volltext und schnelle Stichwort-Treffer
- Embedding-API wandelt Text in Vektoren, gespeichert in SQLite
-
Bei der Suche zu „Wie deploye ich containerisiert?“:
- BM25 findet Chunks mit „Deployment“, „Container“
- Vektor-Suche findet semantisch passende Chunks
- Ergebnisse werden gemischt bewertet, Top-K zurückgegeben
Vorteil: Stichwörter schnell, Semantik präzise – exakte und vage Fragen.
Embedding-Modelle – OpenClaw unterstützt drei:
- Lokal: Offline, Daten bleiben lokal, Qualität evtl. etwas schwächer
- OpenAI Embedding API: Starke Qualität, Cloud, API-Key nötig
- Gemini Embedding API: Google, oft großzügigeres Free-Tier
Konfiguration steuert die Wahl: Privatsphäre → lokal; Qualität → OpenAI oder Gemini.
In der Praxis schlägt Hybrid grep deutlich: Notiz „Nginx Reverse Proxy“ – Frage „Load Balancing einrichten“ – Treffer ohne das Wort „Load Balancing“. Das ist Semantik-Suche.
Privatsphäre und Sicherheit: Local-first
Bei Speicherung stellt sich die Privatsphäre-Frage.
Viele vermeiden sensible Infos in KI-Chats – interne Architektur, Kundendaten – weil unklar ist, ob Cloud, Training oder Dritte im Spiel sind.
OpenClaws Local-first: Alle Gedächtnisdateien lokal, kein Auto-Upload. Cloud-Backup? Dropbox oder Git selbst. Verschlüsselung? VeraCrypt oder FileVault. Sie entscheiden.
Das passt zu „Local-first Software“ – Datensouveränität beim Nutzer.
Lokal heißt nicht automatisch sicher. Risiken:
- API-Key-Leaks: Schlüssel in Gedächtnisdatei + öffentliches GitHub-Repo
- Dateisystem-Rechte: OpenClaw braucht Lese/Schreibzugriff auf memory/ – falsch konfiguriert, missbrauchbar
- Bösartige Skills/Plugins: Erweiterungen könnten lokale Daten abgreifen
- Offene Instanzen: Hunderte OpenClaw-Instanzen ohne Auth im Internet – laut Cisco und Vectra AI
Besonders Punkt 4 ist heikel: Deployment ins Netz ohne Authentifizierung – Angreifer lesen Gedächtnis, führen Befehle aus, setzen Backdoors.
Best Practices:
- Docker-Sandbox: Container isoliert, begrenzter Dateizugriff
- Least Privilege: Nur nötige Rechte, nicht als root
- Verschlüsselung: Sensible Gedächtnisdateien auf FS-Ebene schützen
- Zugriffskontrolle: Bei Internet-Exposure Auth via Nginx (Basic Auth oder OAuth)
- Audit: memory/ und Skill-Liste regelmäßig prüfen
DigitalOcean bietet eine ausführliche Härtungs-Anleitung – lohnenswert.
Local-first gibt Ihnen die Möglichkeit zum Schutz – ob es sicher ist, hängt von Konfiguration und Nutzung ab. Ein Schloss nützt nur, wenn Sie abschließen.
Praxis: Gedächtnisdaten verwalten und optimieren
Theorie reicht – wie pflegen Sie die Dateien?
Dateistruktur
Standard:
memory/
├── 2026-02-05.md # Tageslog
├── MEMORY/ # Persistente Wissensbasis
│ ├── projects/
│ │ ├── project-a.md
│ │ └── project-b.md
│ ├── reference/
│ └── troubleshooting/
└── .memory_index.db # SQLite-Index
Anpassbar nach Bedarf, z. B.:
MEMORY/
├── work/
│ ├── backend-api-design.md
│ └── database-migration-notes.md
├── learning/
│ ├── rust-ownership-model.md
│ └── kubernetes-networking.md
└── personal/
└── recipe-collection.md
Wartungsstrategie
- Regelmäßig aufräumen: Monatlich alte Logs prüfen, Unnötiges löschen, Wichtiges nach MEMORY/
- Manuell editieren: Markdown jederzeit korrigierbar
- Versionierung: memory/ in Git – Commits als Evolutionshistorie
- Backup: Cloud oder externe Platte gegen Festplattenausfall
Performance
Bei vielen Dateien:
- Dateigröße: Einzelne Markdown-Datei < 1 MB, sonst splitten
- Kontextfenster: Standard zwei Tage – bei langsamen Antworten nur heute laden
- Index neu aufbauen:
.memory_index.dblöschen, System baut neu - Archiv-Schwellwert: Ab z. B. 30 Tagen alte Logs komprimieren/archivieren
Tipp: INDEX.md in MEMORY/ mit Übersicht wichtiger Dateien – Fallback, wenn die Suche hakt.
Gedächtnispflege ist wie Notizbuch-Disziplin – etwas Gewohnheit, dann angenehmer als blinde Cloud-Abhängigkeit. Daten in der Hand fühlt sich gut an.
Fazit
Wo soll das Gedächtnis eines KI-Assistenten liegen?
OpenClaws Antwort: Lokale Markdown-Dateien. „Retro“, aber zwei Cloud-Schmerzen weniger – Privatsphäre und Kontrolle.
Zweischicht-Architektur hält recent context ohne Fenster-Explosion. Hybrid-Retrieval (BM25 + Vektoren) macht Textdateien intelligent durchsuchbar. File-first bedeutet: Editor, Git, Dateimanager – Werkzeuge, die Sie kennen.
Kein Allheilmittel: Ideal für privacy-bewusste Entwickler mit Local-Workflow. Multi-Device-Sync, Team ohne Ops? Cloud kann passender sein.
Für mich die Lehre: KI-Gedächtnis muss keine Black Box sein – transparent, steuerbar, Ihnen gehörend.
Beim Agent-Bau: Markdown-Gedächtnis ausprobieren – mit NOTES.md anfangen, System wachsen lassen. Entscheidend ist, wem die Daten gehören.
Details: Offizielle Docs und Quellcode; die Community ist aktiv.
Und: Sicherheit nicht vergessen. Ihr Gedächtnis soll nicht fremdes Asset werden.
OpenClaw-Gedächtnissystem: Konfiguration und Nutzung
Von Installation bis Alltag – Dateistruktur, Sicherheit und Datenpflege
Estimated time: PT45M
-
1
Step 1: Installation und Initialisierung: Speicherverzeichnis
Basisschritte: -
2
Step 2: Sicherheit: Docker-Isolation und Zugriffskontrolle
Docker-Sandbox: -
3
Step 3: Alltag: Schreiben und Suchen
Automatisches Schreiben: -
4
Step 4: Wartung: Backup, Bereinigung, Git
Git (empfohlen): -
5
Step 5: Fortgeschritten: Index und Multi-Projekt
INDEX.md:
FAQ
Verlangsamt Markdown-Speicherung die Suche?
Ablauf:
• Beim Schreiben: Markdown wird automatisch in Chunks zerlegt und indexiert (BM25-Volltext + Vektor-Embedding)
• Bei der Suche: Zuerst passende Chunk-IDs in SQLite, dann Zuordnung zur Markdown-Datei
• Performance: Selbst bei Hunderten Dateien typisch 100–300 ms
Engpass ist oft die Embedding-Erzeugung – bei Remote-APIs Netzwerklatenz; lokale Modelle empfohlen.
Wachsen temporäre Logs unbegrenzt? Automatische Bereinigung?
Archiv-Strategie:
• Standard: Logs der letzten 30 Tage behalten
• Über Schwellwert: Flush-Mechanismus komprimiert oder löscht alte Logs
• Wichtige Infos: Vor Archivierung Hinweis zur Migration ins MEMORY-Verzeichnis
Manuell:
• Regelmäßig memory/ prüfen, unnötige Logs löschen
• Skript: find memory/ -name "*.md" -mtime +30 -exec mv {} archive/ ;
• Monatliche Aufräumung empfohlen
Gedächtnisdaten auf mehreren Rechnern synchronisieren?
1. Git-Remote (empfohlen)
• memory als Git-Repo initialisieren
• Push zu privatem Remote (GitHub Private/GitLab/Gitea)
• Andere Geräte: git pull
• .memory_index.db in .gitignore – Index pro Gerät lokal neu aufbauen
2. Cloud-Sync (einfach)
• Dropbox/Google Drive/OneDrive für memory/
• Konflikte bei gleichzeitigem Schreiben vermeiden
• Index ggf. manuell neu aufbauen
3. Eigener Sync-Dienst
• Syncthing o. Ä.
• Mehr Privatsphäre, keine Drittanbieter-Server
• Etwas Konfigurationsaufwand
Nur Stichwort-Matching ohne Vektorsuche?
Reiner Keyword-Modus:
• Embedding deaktivieren: ENABLE_EMBEDDING=false
• Nur SQLite FTS5 (BM25)
• Vorteile: vollständig lokal, keine API-Keys, schneller
• Nachteile: keine Semantik, exakte Stichwörter nötig
Sinnvoll bei:
• Maximaler Privatsphäre, keine externen APIs
• Code-Snippets, Befehlsprotokolle
• Begrenzte Hardware für lokale Embedding-Modelle
Später: Embedding-Modell konfigurieren und Index neu aufbauen.
API-Schlüssel versehentlich in Gedächtnisdateien – was tun?
• API-Schlüssel widerrufen/neu setzen (Anbieter-Backend)
• Klartext aus Markdown entfernen und speichern
• Bei Push ins Remote-Repo: git filter-branch für Historie
Git-Historie bereinigen:
• BFG: brew install bfg
• Datei löschen: bfg --delete-files secrets.md
• Text ersetzen: bfg --replace-text passwords.txt
• Force-Push: git push --force
Prävention:
• git-secrets: git secrets --install
• pre-commit Hook für sensible Daten
• Umgebungsvariablen statt Klartext: ${DATABASE_PASSWORD}
• Regelmäßiges Audit von memory/
Unterstützt OpenClaw mehrere Benutzer?
Mehrbenutzer auf einem Host:
• Pro User eigenes memory: /data/user1/memory, /data/user2/memory
• Mehrere OpenClaw-Instanzen, verschiedene Ports, unterschiedliche MEMORY_PATH
• Nginx-Reverse-Proxy nach Pfad
• Beispiel: /user1/* → localhost:3001, /user2/* → localhost:3002
Team:
• memory in Git, gemeinsame Pflege
• Branches für persönliche Bereiche: git checkout -b user/alice
• Wichtiges in main mergen
• GitHub/GitLab-Rechte
Hinweise:
• Index pro User getrennt
• Geteiltes Gedächtnis: Markdown manuell kopieren
• Docker-Container pro User für Isolation empfohlen
6 Min. Lesezeit · Veröffentlicht am: 5. Feb. 2026 · Aktualisiert am: 20. Juni 2026
OpenClaw Deployment & Praxis
Wenn du über die Suche hier gelandet bist, kommst du am schnellsten weiter, indem du zum vorherigen oder nächsten Beitrag dieser Serie springst.
Vorheriger
KI liest Dokumentation für Sie: OpenClaw Browser-Automatisierung – Praxisleitfaden
Mit OpenClaw Browser Skills API-Dokumentation automatisch erfassen, Wettbewerber überwachen und Webinhalte extrahieren – in 2 Minuten statt einer halben Stunde. Inklusive vollständiger Befehlsanleitung und Sicherheitsleitfaden.
Teil 13 von 36
Nächster
OpenClaw Multi-Agent-Routing: Work, Privat und Experiment sauber trennen
Mit OpenClaw Multi-Agent-Routing trennen Sie KI-Assistenten-Szenarien – ohne Kontextvermischung und Datenlecks. Fünf Praxis-Setups plus vollständiges Deployment-Tutorial.
Teil 15 von 36
Ähnliche Beiträge
OpenClaw-Umbenennung: Von Clawdbot über Moltbot bis OpenClaw – die komplette Geschichte
OpenClaw-Umbenennung: Von Clawdbot über Moltbot bis OpenClaw – die komplette Geschichte
OpenClaw Installationsleitfaden: Von der Umgebungsvorbereitung bis zum ersten Start
OpenClaw Installationsleitfaden: Von der Umgebungsvorbereitung bis zum ersten Start
OpenClaw Cloud-Server vs. lokaler Betrieb: Die passende Deployment-Strategie wählen
Kommentare
Melde dich mit GitHub an, um einen Kommentar zu hinterlassen