Sprache wechseln
Design wechseln

OpenClaw Gedächtnissystem erklärt: KI-Erinnerungen in Markdown-Dateien

Letzte Woche ließ ich die KI eine Architektur analysieren – im Chatverlauf war alles längst weg. KI-Assistenten lösen Probleme, vergessen aber schnell: Nach dem Gespräch ist fast alles weg. Und wo landen die Dialogdaten? Auf Cloud-Servern? Wer kann sie sehen?

OpenClaw speichert alle KI-Erinnerungen in Markdown-Dateien auf Ihrer lokalen Festplatte. Das löst zwei Probleme: Die KI behält Langzeitgedächtnis, und die Daten werden nicht in die Cloud hochgeladen.

Dieser Artikel erklärt OpenClaws Gedächtnissystem: Zweischicht-Architektur (temporäre Logs + persistentes Wissen), Hybrid-Retrieval (BM25 + Vektor-Semantik) und lokaler Datenschutz. Daten bleiben unter Ihrer Kontrolle – jederzeit in VSCode bearbeitbar, mit Git versionierbar.

Günstiger Einstieg: ArkClaw macht KI-Agenten zugänglich

OpenClaw (der „Hummer“) ist beliebt, aber die Einrichtung schreckt ab? ByteDance Volcano Engine bietet ArkClaw mit minimaler Hürde: ohne Server- und Token-Gefummel einen 24/7-Agenten mit Browser, Skripten und Kalender.

Preis: 9,9 Yuan/Monat; mit Einladungscode ZLKUK54M (hier registrieren) 8,9 Yuan. Entwickler: Coding Plan Pro kann kostenlos nutzbar sein.

Warum Markdown: File-first als Designphilosophie

Beim ersten Anblick war ich skeptisch: Markdown für Dokumente – und plötzlich als KI-Datenbank?

Bei näherer Betrachtung ist das Design schlau.

Liegen alle Erinnerungen in PostgreSQL, brauchen Sie einen DB-Client und SQL, nur um zu sehen, was die KI gespeichert hat. Bei Markdown? VSCode öffnen – fertig. Ändern? Speichern. Backup? Ordner kopieren. Stand von letzter Woche? Ein Git-Befehl.

OpenClaw nennt das „File-first“. Markdown ist die „Single Source of Truth“; die Datenbank dient nur Indexierung und schneller Suche.

Das erinnert an Anthropics NOTES.md-Empfehlung: Entwickler legen NOTES.md an, dokumentieren Entscheidungen und Kontext – die KI liest bei jedem Start mit. OpenClaw treibt das weiter: nicht eine Datei, sondern das gesamte Gedächtnissystem auf Markdown.

Vergleich mit klassischen Ansätzen:

  • Redis/In-Memory: Schnell, aber nach Neustart weg – extra Persistenz nötig
  • PostgreSQL/MySQL: Mächtig, aber schwer, wartungsintensiv, Daten wenig transparent
  • Vektordatenbank (z. B. Pinecone): Für KI gemacht, oft Cloud – Daten verlassen den Rechner

Vorteile von Markdown:

  1. Lesbar: Sie sehen jederzeit, was die KI „weiß“
  2. Kontrolle: Daten auf Ihrer Platte – Backup, Löschen, Verschlüsselung nach Belieben
  3. Git-tauglich: Versionshistorie, sogar Teamarbeit
  4. Keine Abhängigkeiten: Kein DB-Dienst, kein Docker-Zwang, keine Cloud

Schwäche: Retrieval bei vielen Textdateien – dazu gleich mehr.

Zweischicht-Gedächtnis: Temporär und persistent im Gleichgewicht

OpenClaws Gedächtnis ähnelt dem menschlichen: Kurz- und Langzeitgedächtnis – bei OpenClaw Daily Logs und Curated Knowledge.

Temporäre Logs sind wie Kurzzeitgedächtnis: Heutige Aktivitäten landen in memory/YYYY-MM-DD.md. Am 5. Februar 2026 entsteht memory/2026-02-05.md, Append-only.

Clever: OpenClaw lädt automatisch heutige und gestrige Logs. Zwei Tage halten den Kontext frisch – gestern Besprochenes ist heute noch da. Ältere Logs werden nicht automatisch geladen, sonst explodiert das Kontextfenster.

Persistentes Wissen liegt im MEMORY-Ordner – manuell oder automatisch extrahierte wichtige Infos: Architektur, Entscheidungen, Code-Snippets.

Strukturbeispiel:

memory/
├── 2026-02-01.md          # Alt, nicht auto-geladen
├── 2026-02-04.md          # Gestern, auto-geladen
├── 2026-02-05.md          # Heute, auto-geladen
└── MEMORY/
    ├── project-architecture.md   # Persistent, bei Bedarf per Suche
    ├── deployment-notes.md
    └── troubleshooting-guide.md

Beim Start liest die KI die letzten zwei Tage in den Kontext – nahtlose Fortsetzung unterbrochener Themen. Infos von vor einem Monat finden Sie per Retrieval im MEMORY-Ordner.

Praktisch: Auto-Archivierung. Bei vielen Logs triggert OpenClaw Flush – Komprimierung oder Archiv, damit die Platte nicht voll läuft. Wichtiges wandert in persistenten Speicher.

Das erinnert an die Vergessenskurve: Nicht alles muss ewig bleiben; Wichtiges sinkt ins Langzeitgedächtnis.

Effizientes Retrieval: SQLite und Hybrid-Suche

Problem: Hunderte Markdown-Dateien – wie findet man schnell Relevantes?

Grep allein reicht nicht. Sie suchen „Container-Deployment“, die Notiz heißt „Docker-Image-Build und K8s-Deployment“ – kein Stichwort-Treffer. Reine Textsuche versteht keine Semantik.

OpenClaws Antwort: Hybrid-Retrieval – BM25 (Stichwörter) plus Vektor-Ähnlichkeit.

So funktioniert es:

  1. Index-Schicht: SQLite. Beim Schreiben werden Inhalte in Chunks geteilt:

    • FTS5 für Volltext und schnelle Stichwort-Treffer
    • Embedding-API wandelt Text in Vektoren, gespeichert in SQLite
  2. Bei der Suche zu „Wie deploye ich containerisiert?“:

    • BM25 findet Chunks mit „Deployment“, „Container“
    • Vektor-Suche findet semantisch passende Chunks
    • Ergebnisse werden gemischt bewertet, Top-K zurückgegeben

Vorteil: Stichwörter schnell, Semantik präzise – exakte und vage Fragen.

Embedding-Modelle – OpenClaw unterstützt drei:

  • Lokal: Offline, Daten bleiben lokal, Qualität evtl. etwas schwächer
  • OpenAI Embedding API: Starke Qualität, Cloud, API-Key nötig
  • Gemini Embedding API: Google, oft großzügigeres Free-Tier

Konfiguration steuert die Wahl: Privatsphäre → lokal; Qualität → OpenAI oder Gemini.

In der Praxis schlägt Hybrid grep deutlich: Notiz „Nginx Reverse Proxy“ – Frage „Load Balancing einrichten“ – Treffer ohne das Wort „Load Balancing“. Das ist Semantik-Suche.

Privatsphäre und Sicherheit: Local-first

Bei Speicherung stellt sich die Privatsphäre-Frage.

Viele vermeiden sensible Infos in KI-Chats – interne Architektur, Kundendaten – weil unklar ist, ob Cloud, Training oder Dritte im Spiel sind.

OpenClaws Local-first: Alle Gedächtnisdateien lokal, kein Auto-Upload. Cloud-Backup? Dropbox oder Git selbst. Verschlüsselung? VeraCrypt oder FileVault. Sie entscheiden.

Das passt zu „Local-first Software“ – Datensouveränität beim Nutzer.

Lokal heißt nicht automatisch sicher. Risiken:

  1. API-Key-Leaks: Schlüssel in Gedächtnisdatei + öffentliches GitHub-Repo
  2. Dateisystem-Rechte: OpenClaw braucht Lese/Schreibzugriff auf memory/ – falsch konfiguriert, missbrauchbar
  3. Bösartige Skills/Plugins: Erweiterungen könnten lokale Daten abgreifen
  4. Offene Instanzen: Hunderte OpenClaw-Instanzen ohne Auth im Internet – laut Cisco und Vectra AI

Besonders Punkt 4 ist heikel: Deployment ins Netz ohne Authentifizierung – Angreifer lesen Gedächtnis, führen Befehle aus, setzen Backdoors.

Best Practices:

  • Docker-Sandbox: Container isoliert, begrenzter Dateizugriff
  • Least Privilege: Nur nötige Rechte, nicht als root
  • Verschlüsselung: Sensible Gedächtnisdateien auf FS-Ebene schützen
  • Zugriffskontrolle: Bei Internet-Exposure Auth via Nginx (Basic Auth oder OAuth)
  • Audit: memory/ und Skill-Liste regelmäßig prüfen

DigitalOcean bietet eine ausführliche Härtungs-Anleitung – lohnenswert.

Local-first gibt Ihnen die Möglichkeit zum Schutz – ob es sicher ist, hängt von Konfiguration und Nutzung ab. Ein Schloss nützt nur, wenn Sie abschließen.

Praxis: Gedächtnisdaten verwalten und optimieren

Theorie reicht – wie pflegen Sie die Dateien?

Dateistruktur

Standard:

memory/
├── 2026-02-05.md          # Tageslog
├── MEMORY/                # Persistente Wissensbasis
│   ├── projects/
│   │   ├── project-a.md
│   │   └── project-b.md
│   ├── reference/
│   └── troubleshooting/
└── .memory_index.db       # SQLite-Index

Anpassbar nach Bedarf, z. B.:

MEMORY/
├── work/
│   ├── backend-api-design.md
│   └── database-migration-notes.md
├── learning/
│   ├── rust-ownership-model.md
│   └── kubernetes-networking.md
└── personal/
    └── recipe-collection.md

Wartungsstrategie

  1. Regelmäßig aufräumen: Monatlich alte Logs prüfen, Unnötiges löschen, Wichtiges nach MEMORY/
  2. Manuell editieren: Markdown jederzeit korrigierbar
  3. Versionierung: memory/ in Git – Commits als Evolutionshistorie
  4. Backup: Cloud oder externe Platte gegen Festplattenausfall

Performance

Bei vielen Dateien:

  • Dateigröße: Einzelne Markdown-Datei < 1 MB, sonst splitten
  • Kontextfenster: Standard zwei Tage – bei langsamen Antworten nur heute laden
  • Index neu aufbauen: .memory_index.db löschen, System baut neu
  • Archiv-Schwellwert: Ab z. B. 30 Tagen alte Logs komprimieren/archivieren

Tipp: INDEX.md in MEMORY/ mit Übersicht wichtiger Dateien – Fallback, wenn die Suche hakt.

Gedächtnispflege ist wie Notizbuch-Disziplin – etwas Gewohnheit, dann angenehmer als blinde Cloud-Abhängigkeit. Daten in der Hand fühlt sich gut an.

Fazit

Wo soll das Gedächtnis eines KI-Assistenten liegen?

OpenClaws Antwort: Lokale Markdown-Dateien. „Retro“, aber zwei Cloud-Schmerzen weniger – Privatsphäre und Kontrolle.

Zweischicht-Architektur hält recent context ohne Fenster-Explosion. Hybrid-Retrieval (BM25 + Vektoren) macht Textdateien intelligent durchsuchbar. File-first bedeutet: Editor, Git, Dateimanager – Werkzeuge, die Sie kennen.

Kein Allheilmittel: Ideal für privacy-bewusste Entwickler mit Local-Workflow. Multi-Device-Sync, Team ohne Ops? Cloud kann passender sein.

Für mich die Lehre: KI-Gedächtnis muss keine Black Box sein – transparent, steuerbar, Ihnen gehörend.

Beim Agent-Bau: Markdown-Gedächtnis ausprobieren – mit NOTES.md anfangen, System wachsen lassen. Entscheidend ist, wem die Daten gehören.

Details: Offizielle Docs und Quellcode; die Community ist aktiv.

Und: Sicherheit nicht vergessen. Ihr Gedächtnis soll nicht fremdes Asset werden.

OpenClaw-Gedächtnissystem: Konfiguration und Nutzung

Von Installation bis Alltag – Dateistruktur, Sicherheit und Datenpflege

Estimated time: PT45M

  1. 1

    Step 1: Installation und Initialisierung: Speicherverzeichnis

    Basisschritte:
  2. 2

    Step 2: Sicherheit: Docker-Isolation und Zugriffskontrolle

    Docker-Sandbox:
  3. 3

    Step 3: Alltag: Schreiben und Suchen

    Automatisches Schreiben:
  4. 4

    Step 4: Wartung: Backup, Bereinigung, Git

    Git (empfohlen):
  5. 5

    Step 5: Fortgeschritten: Index und Multi-Projekt

    INDEX.md:

FAQ

Verlangsamt Markdown-Speicherung die Suche?
Nein. OpenClaw nutzt SQLite-Indizes; bei der Suche werden nicht alle Markdown-Dateien gescannt, sondern die Index-Datenbank abgefragt.

Ablauf:
• Beim Schreiben: Markdown wird automatisch in Chunks zerlegt und indexiert (BM25-Volltext + Vektor-Embedding)
• Bei der Suche: Zuerst passende Chunk-IDs in SQLite, dann Zuordnung zur Markdown-Datei
• Performance: Selbst bei Hunderten Dateien typisch 100–300 ms

Engpass ist oft die Embedding-Erzeugung – bei Remote-APIs Netzwerklatenz; lokale Modelle empfohlen.
Wachsen temporäre Logs unbegrenzt? Automatische Bereinigung?
OpenClaw hat Auto-Archivierung – kein unbegrenztes Wachstum.

Archiv-Strategie:
• Standard: Logs der letzten 30 Tage behalten
• Über Schwellwert: Flush-Mechanismus komprimiert oder löscht alte Logs
• Wichtige Infos: Vor Archivierung Hinweis zur Migration ins MEMORY-Verzeichnis

Manuell:
• Regelmäßig memory/ prüfen, unnötige Logs löschen
• Skript: find memory/ -name "*.md" -mtime +30 -exec mv &#123;&#125; archive/ ;
• Monatliche Aufräumung empfohlen
Gedächtnisdaten auf mehreren Rechnern synchronisieren?
Drei Ansätze:

1. Git-Remote (empfohlen)
• memory als Git-Repo initialisieren
• Push zu privatem Remote (GitHub Private/GitLab/Gitea)
• Andere Geräte: git pull
• .memory_index.db in .gitignore – Index pro Gerät lokal neu aufbauen

2. Cloud-Sync (einfach)
• Dropbox/Google Drive/OneDrive für memory/
• Konflikte bei gleichzeitigem Schreiben vermeiden
• Index ggf. manuell neu aufbauen

3. Eigener Sync-Dienst
• Syncthing o. Ä.
• Mehr Privatsphäre, keine Drittanbieter-Server
• Etwas Konfigurationsaufwand
Nur Stichwort-Matching ohne Vektorsuche?
Ja. OpenClaw erlaubt flexible Retrieval-Konfiguration.

Reiner Keyword-Modus:
• Embedding deaktivieren: ENABLE_EMBEDDING=false
• Nur SQLite FTS5 (BM25)
• Vorteile: vollständig lokal, keine API-Keys, schneller
• Nachteile: keine Semantik, exakte Stichwörter nötig

Sinnvoll bei:
• Maximaler Privatsphäre, keine externen APIs
• Code-Snippets, Befehlsprotokolle
• Begrenzte Hardware für lokale Embedding-Modelle

Später: Embedding-Modell konfigurieren und Index neu aufbauen.
API-Schlüssel versehentlich in Gedächtnisdateien – was tun?
Sofort:

• API-Schlüssel widerrufen/neu setzen (Anbieter-Backend)
• Klartext aus Markdown entfernen und speichern
• Bei Push ins Remote-Repo: git filter-branch für Historie

Git-Historie bereinigen:
• BFG: brew install bfg
• Datei löschen: bfg --delete-files secrets.md
• Text ersetzen: bfg --replace-text passwords.txt
• Force-Push: git push --force

Prävention:
• git-secrets: git secrets --install
• pre-commit Hook für sensible Daten
• Umgebungsvariablen statt Klartext: $&#123;DATABASE_PASSWORD&#125;
• Regelmäßiges Audit von memory/
Unterstützt OpenClaw mehrere Benutzer?
Nicht nativ – aber per Verzeichnis-Isolation.

Mehrbenutzer auf einem Host:
• Pro User eigenes memory: /data/user1/memory, /data/user2/memory
• Mehrere OpenClaw-Instanzen, verschiedene Ports, unterschiedliche MEMORY_PATH
• Nginx-Reverse-Proxy nach Pfad
• Beispiel: /user1/* → localhost:3001, /user2/* → localhost:3002

Team:
• memory in Git, gemeinsame Pflege
• Branches für persönliche Bereiche: git checkout -b user/alice
• Wichtiges in main mergen
• GitHub/GitLab-Rechte

Hinweise:
• Index pro User getrennt
• Geteiltes Gedächtnis: Markdown manuell kopieren
• Docker-Container pro User für Isolation empfohlen

6 Min. Lesezeit · Veröffentlicht am: 5. Feb. 2026 · Aktualisiert am: 20. Juni 2026

Ähnliche Beiträge

Kommentare

Melde dich mit GitHub an, um einen Kommentar zu hinterlassen