OpenClaw Fernsteuerung: Ihr Smartphone als persönliche KI-Betriebssystem-Fernbedienung
Im Café – dringende Aufgabe, aber die PDF liegt auf dem Desktop zu Hause. Smartphone raus, Telegram-Nachricht an „ClawBot“: „Mach einen Screenshot vom Desktop.“ Zehn Sekunden später: Desktop-Bildschirmfoto, PDF-Datei sichtbar. Nächste Nachricht: „Öffne die Datei und fass Seite drei zusammen.“ Zwei Minuten später: Zusammenfassung der dritten Seite.
Solche Szenarien sind für mich in den letzten Monaten Alltag geworden. Seit OpenClaw als persönliches KI-Betriebssystem läuft, ist mein iPhone eine echte Fernbedienung – Heim-PC-Kamera, Standort, Remote-Screenshots. Alles mit Open-Source-Tools, Daten vollständig bei mir.
Wenn Sie Ihr Smartphone zur echten Steuerzentrale Ihres KI-Agenten machen wollen – statt in Hersteller-Funktionen gefangen zu sein – ist dieser OpenClaw-Fernsteuerungs-Leitfaden für Sie. Keine Theorie, direkt zur Praxis.
Günstiger Einstieg: ArkClaw macht KI-Agenten zugänglich
OpenClaw (der „Hummer“) ist mächtig, aber die Einrichtung abschreckend? ByteDance Volcano Engine bietet ArkClaw mit minimalem Aufwand: ohne Server- und Token-Konfiguration einen 24/7-online Agent mit Browser-, Skript- und Kalendersteuerung.
Preis: 9,9 Yuan/Monat; mit Einladungscode ZLKUK54M (hier registrieren) 8,9 Yuan. Entwickler: Coding Plan Pro inklusive.
Das OpenClaw-Gateway-Protokoll verstehen (Layer 1 – Grundlagen)
Um Ihr Smartphone zur OpenClaw-Fernbedienung zu machen, sollten Sie verstehen, wie das System arbeitet. „Gateway-Protokoll“ klingt technisch – im Kern geht es um eine gemeinsame Sprache, mit der Geräte sich erkennen.
OpenClaw nutzt das Gateway WS Protocol (Gateway-WebSocket-Protokoll). Alle Geräte – Hauptsteuerung am PC, Node auf dem Smartphone, Chat-Oberfläche in Telegram – hängen über eine persistente WebSocket-Verbindung an einer einheitlichen Steuerungsebene. Jedes Gerät meldet Identität und Fähigkeiten beim Verbinden.
Beispiel: Ihr iPhone meldet: „Ich bin ein iOS-Node mit Kamera, Screenshot und Standort.“ Der PC: „Ich bin das Gateway und koordiniere.“ Der Telegram Bot: „Ich bin Client und nehme Befehle entgegen.“
Drei Kernrollen – wenn Sie diese verstehen, wird die Konfiguration einfacher:
Gateway: Das „Gehirn“ des Systems, typischerweise auf PC oder Server. Alle Befehle laufen hier ein und werden an Nodes verteilt.
Node: Gerät, das konkrete Aufgaben ausführt. iPhone, Android oder ein altes Smartphone als Node. Jeder Node deklariert caps (Capabilities), z. B. camera, screen, location, voice.
Client: Oberfläche zum Senden von Befehlen – Telegram, Discord, iOS-App oder Web-UI.
Die Frage: Ist es sicher, dem Smartphone so viele Rechte zu geben?
Das war auch meine erste Sorge. OpenClaw adressiert das: Token-Authentifizierung, Gerätesignatur, TLS-Verschlüsselung. Entscheidend: feingranulare Rechte – der Node kann „Kamera verfügbar“ melden, das Gateway kann „dieser Client darf nur Screenshot, nicht Kamera“ erlauben.
[Bild: OpenClaw-Gateway-Protokoll – Gateway, Node, Client]
Prompt: Technisches Architekturdiagramm, Gateway als Zentrum mit iOS- und Android-Geräten, blauer Tech-Stil, klar und übersichtlich, high quality
In der Node-Konfiguration sehen Sie typischerweise:
{
"role": "node",
"caps": ["camera", "screen", "location"],
"commands": ["camera.snap", "screen.record", "location.get"],
"permissions": {
"camera.capture": true,
"screen.record": false
}
}
Bedeutung: Der Node kann fotografieren, Screenshots und Standort – ob das Gateway es erlaubt, steht in permissions. Selbst bei Kompromittierung bleibt der Schaden begrenzt.
Mobile Node-Konfiguration in der Praxis (Layer 2 – Fortgeschritten)
Nach dem Protokoll folgt die Umsetzung – getrennt für iOS und Android.
iOS-Node-Konfiguration
OpenClaw ist nicht im App Store – TestFlight (bei Beta-Zugang) oder Self-Signed IPA, z. B. mit AltStore (monatliche Neusignierung).
Nach der Installation: Node-Konfiguration. Wichtige Felder:
Gateway URL: WebSocket-Adresse des Gateways. Im LAN z. B. ws://192.168.1.100:8080. Extern: Reverse Proxy mit wss://. Ich nutze Cloudflare Tunnel – ohne öffentliche IP.
Client ID: Eindeutiger Name, z. B. „iphone-15-main“.
Auth Token: Vom Gateway generiertes Token einfügen.
Capabilities: Gewünschte Fähigkeiten aktivieren. Beim ersten Mal nur location, danach camera und screen – nicht alles auf einmal.
Verbinden – grüner „Connected“-Status bedeutet: Node hängt am Gateway.
iOS-Hintergrundlimit: Apps werden im Hintergrund beendet. Lösungen: „Hintergrundaktualisierung“ aktivieren oder gelegentlich die App öffnen. Ich lasse den Node auf einem Ersatzgerät laufen.
Android-Node-Konfiguration
Flexibler: offizielles APK oder Node-Version in Termux.
APK wie bei iOS: installieren, konfigurieren, verbinden. Android-Hintergrund ist toleranter. Bei Huawei, Xiaomi, OPPO usw. „Hintergrundausführung erlauben“ manuell setzen.
Termux für Tüftler: Node.js, npm install openclaw, Node per CLI starten – detaillierte Logs, aber Hintergrund-Kill; Termux:Boot und Tasker helfen beim Keep-Alive.
[Bild: OpenClaw-Node in Termux auf Android]
Prompt: Smartphone-Screenshot, Termux mit erfolgreichem OpenClaw-Node-Log, Dark Mode, grüner Text, high quality
Sicherheit auf beiden Plattformen: Prinzip der minimalen Rechte. Brauchen Sie wirklich die Kamera? Nur Standort und gelegentlicher Screenshot – Kamera weglassen.
Gerätesignatur: Schlüsselpaar erzeugen, Public Key ins Gateway, Private Key auf dem Node. Token allein reicht nicht – ich erzwinge Signatur am Gateway.
Telegram-Fernsteuerung in der Praxis
Node online – wie steuern? Am direktesten: Telegram. Keine Extra-App, Telegram öffnen und los.
Bot bei @BotFather anlegen, Token erhalten. In OpenClaws channels Telegram-Plugin mit Token eintragen, Gateway neu starten – Bot lebt.
channels:
telegram:
token: "YOUR_BOT_TOKEN"
mode: polling
Polling ist am einfachsten für Privatnutzer. Webhook braucht öffentliche HTTPS-URL, reagiert aber schneller.
Standardmäßig leitet OpenClaw Nachrichten an die KI – für Remote-Hardware brauchen Sie explizite Befehle.
In skills Fähigkeiten an Befehle binden:
skills:
remote_control:
commands:
camera:
target: "iphone-15-main"
action: "camera.snap"
screenshot:
target: "iphone-15-main"
action: "screen.capture"
where:
target: "iphone-15-main"
action: "location.get"
Danach: /camera in Telegram → Foto vom iPhone. /where → GPS-Koordinaten.
Als das erste Remote-Foto ankam, war das ein starker Moment – ein eigener Assistent, komplett unter Ihrer Kontrolle.
[Bild: Telegram mit /camera und zurückgesendetem Foto]
Prompt: Telegram-Chat, Nutzer sendet /camera, Bot antwortet mit Foto, Mobil-UI, high quality
Telegram-Gruppen: Bot in private Gruppe – bessere Historie. Familienfreigabe möglich – Rechte sauber setzen (Nacht-Screenshots vermeiden …).
Bilder und Dokumente an den Bot: OpenClaw kann analysieren oder in ein Verzeichnis speichern – quasi geräteübergreifende Zwischenablage.
Dedizierte App und fortgeschrittene Szenarien
Telegram ist praktisch, aber als Chat-Oberfläche limitiert – schneller Kamera-Blick oder Node-Übersicht brauchen oft mehr.
OpenClaw Web UI standardmäßig unter http://localhost:3000 – Dashboard im mobilen Browser. Extern: Reverse Proxy.
Ich nutze Nginx mit HTTP Basic Auth, Lesezeichen im Browser – online Nodes, Capabilities, Logs; manuell Camera klicken → Foto vom Phone.
Community-Tools wie ClawDash mit Custom-Layouts – Sicherheit selbst prüfen, da sie ans Gateway connecten.
Automatisierungs-Workflows
Event-getriggerte Skills – z. B. Geofence: Wenn mein Phone-Node „Zuhause“ betritt, startet der Heim-PC die Musik.
Geplanter Screenshot: Ersatz-Android täglich 8 Uhr – KI prüft Anomalien (Gerät vergessen?), Telegram-Alert bei Bedarf.
Beispiel-Konfiguration:
automations:
- name: "arrive_home"
trigger:
type: "geofence"
device: "iphone-15-main"
location: "home"
action:
target: "macbook-pro"
skill: "music.play"
- name: "morning_check"
trigger:
type: "schedule"
cron: "0 8 * * *"
action:
target: "android-spare"
skill: "screen.analyze"
Fehlerbehebung
Typische Stolpersteine:
Keine Gateway-Verbindung: WebSocket-URL und Port prüfen, curl ws://gateway-ip:port testen. Bei wss: Zertifikat validieren.
Node offline, App zeigt verbunden: Oft falsche role – muss "node" sein, nicht "client".
Befehl ohne Reaktion: Gateway-Logs – Routing und Device-ID prüfen.
Permission denied: Node-permissions und Gateway-Policy – beide Seiten müssen zustimmen.
Fazit
Kurz drei Punkte:
Erstens: OpenClaw Gateway Protocol ist ein einheitlicher Standard für Geräteverbindungen – Smartphone und PC auf einer Steuerungsebene. WebSocket plus klare Rollen- und Capability-Deklaration.
Zweitens: Smartphone als Node = mobiler Sensor und Executor. Kamera, Standort, Bildschirm – Hardware-Fähigkeiten für Ihren KI-Agenten.
Drittens: Telegram oder dedizierte App als Steuerung – von überall Befehle ans Heim-System. Daten und Entscheidungen bleiben bei Ihnen – greifbarer als viele Cloud-Assistenten.
Mein Rat: Heute Abend ein Ersatz-Smartphone nach Kapitel zwei einrichten – selbst nur Remote-Foto vermittelt das Gefühl, „überall Augen“ zu haben.
Die Open-Source-Community erweitert OpenClaw ständig. Layer 2 ist Hardware-Steuerung – mehr kommt. Wer weiß.
Mein Phone ist längst mehr als ein Phone – Fernbedienung meines KI-Betriebssystems. Ihres kann es auch werden.
Vollständiger Ablauf: OpenClaw-Mobilgerät als Node konfigurieren
Detaillierte Schritte, um ein iOS- oder Android-Gerät als OpenClaw-Node einzurichten – Gateway-Verbindung, Berechtigungen und Telegram-Bot-Steuerung
⏱️ Estimated time: 30 min
- 1
Step1: Vorbereitung: OpenClaw-Node-App installieren
iOS-Nutzer:
• OpenClaw-iOS-Client per TestFlight oder AltStore-Self-Signing installieren
• „Hintergrundaktualisierung“ aktivieren, damit der Node online bleibt
Android-Nutzer:
• Variante A: Offizielles APK installieren, „Hintergrundausführung erlauben“ setzen
• Variante B: In Termux `npm install openclaw` ausführen
Hinweis: Ein Ersatzgerät eignet sich besser für dauerhaft laufende Nodes; Hauptgeräte können durch Hintergrundlimits beeinträchtigt werden - 2
Step2: Node-Verbindungsparameter konfigurieren
Wichtige Felder:
• Gateway URL: ws://LAN-IP:Port oder wss://öffentliche-Domain
• Client ID: Eindeutige Kennung, z. B. „iphone-15-main“
• Auth Token: Vom Gateway generiertes Authentifizierungs-Token
• Capabilities: Nach Bedarf location/camera/screen aktivieren
Sicherheitsempfehlungen:
• Zuerst Geräteschlüsselpaar erzeugen – Public Key ins Gateway, Private Key auf dem Node
• Beim ersten Setup nur location freigeben, weitere Berechtigungen nach erfolgreichem Test
• Prinzip der minimalen Rechte – kleinere Angriffsfläche - 3
Step3: Telegram-Bot-Steuerung einrichten
Bot erstellen:
• In Telegram @BotFather kontaktieren, /newbot ausführen
• Erhaltenes Bot Token sichern
OpenClaw konfigurieren:
• Telegram-Plugin in channels hinzufügen
• mode: polling (privat) oder webhook (schnellere Reaktion)
• In skills Befehle an Node-Fähigkeiten binden, z. B. /camera → camera.snap
Testbefehle:
• /camera – Remote-Foto
• /where – Standort abfragen
• /screenshot – Bildschirmfoto - 4
Step4: Fortgeschritten: Automatisierungs-Workflows
Geofence-Trigger:
• Skills automatisch ausführen beim Betreten/Verlassen einer Zone
• Beispiel: Zu Hause automatisch Musik abspielen
Geplante Tasks:
• Mit Cron-Ausdruck zeitgesteuert auslösen
• Beispiel: Täglich um 8 Uhr Screenshot zur Kontrolle
Fehlerbehebung:
• Keine Gateway-Verbindung: WebSocket-Adresse und TLS-Zertifikat prüfen
• Node offline: role muss „node“ sein, nicht „client“
• Keine Befehlsreaktion: Gateway-Logs prüfen, ob Routing korrekt ist
FAQ
Welche technischen Vorkenntnisse braucht die OpenClaw-Node-Konfiguration?
• Grundlegende Kommandozeilen-Nutzung
• Verständnis von WebSocket und Token-Authentifizierung
• YAML-Dateien konfigurieren können
iOS-Nutzer sollten TestFlight oder Self-Signing kennen. Android-Nutzer mit Termux brauchen grundlegende Linux-Befehle. Mit typischem Entwickler-Niveau ist die Einrichtung in etwa 30 Minuten machbar.
Verbraucht ein Smartphone als Node viel Akku?
• Nur location: sehr gering, kaum spürbar
• camera und screen: nur bei Nutzung, im Idle kaum relevant
• WebSocket-Dauerverbindung: Heartbeat verbraucht wenig Strom
Empfehlung: Ersatzgerät als Node, Hauptgerät normal nutzen. Oder Node nur bei Bedarf aktivieren. iOS: Hintergrundlimits beachten; Android: Energiesparmodus anpassen.
Ist OpenClaw-Fernsteuerung sicher?
• Token-Authentifizierung bei der Verbindung
• Gerätesignatur mit Public-/Private-Key gegen Token-Missbrauch
• TLS-Verschlüsselung bei wss für externen Zugriff
• Feingranulare Rechte: Node deklariert Fähigkeiten, Gateway steuert Client-Aufrufe
• Self-Hosting: Keine Daten über Drittanbieter – volle Kontrolle
Best Practice: Gerätesignatur erzwingen + minimale Rechte + Token regelmäßig rotieren.
Telegram Bot oder dedizierte App – was ist praktischer?
Telegram Bot:
• Vorteile: Keine Extra-App, überall verfügbar, Gruppenfreigabe
• Nachteile: Chat-Oberfläche weniger intuitiv, komplexe Aktionen umständlich
Dedizierte App / Web UI:
• Vorteile: Visuelle Oberfläche, One-Click-Aktionen, Node-Status auf einen Blick
• Nachteile: Reverse Proxy für externen Zugriff, ggf. zusätzliche App
Empfehlung: Telegram Bot für den Alltag; Web UI bei komplexen oder häufigen Aktionen.
Welche Geräte lassen sich außer dem Smartphone noch steuern?
• Computer (macOS/Windows/Linux): als Gateway oder Node
• Raspberry Pi: ideal für dauerhaften Low-Power-Betrieb
• Android TV / TV-Box: Media Center remote steuern
• Alte Smartphones/Tablets: als dedizierter Monitor-Node
Voraussetzung: Node.js oder OpenClaw-Client plus WebSocket. Mit der Community wächst die Geräteliste.
6 Min. Lesezeit · Veröffentlicht am: 26. Feb. 2026 · Aktualisiert am: 20. Juni 2026
OpenClaw Deployment & Praxis
Wenn du über die Suche hier gelandet bist, kommst du am schnellsten weiter, indem du zum vorherigen oder nächsten Beitrag dieser Serie springst.
Vorheriger
Keine API-Rechnungsangst mehr: 80 % OpenClaw-Kosten mit Modell-Routing sparen
OpenClaw-Dreischicht-Modell-Routing: Llama 3 lokal statt Claude für einfache Tasks – 70–80 % weniger API-Kosten in der Praxis. Vollständiges Setup plus echte Rechnungsvergleiche.
Teil 26 von 36
Nächster
Vom Einsteiger zum Pro: 5 Sicherheitsschalter in der OpenClaw-Erstkonfiguration, die Sie nicht ignorieren dürfen
OpenClaw lokal absichern: Gateway-Authentifizierung, Docker-Sandbox, Approval Gates und vier weitere Schlüsselkonfigurationen für sicheren KI-Agent-Einsatz
Teil 28 von 36
Ähnliche Beiträge
OpenClaw-Umbenennung: Von Clawdbot über Moltbot bis OpenClaw – die komplette Geschichte
OpenClaw-Umbenennung: Von Clawdbot über Moltbot bis OpenClaw – die komplette Geschichte
OpenClaw Installationsleitfaden: Von der Umgebungsvorbereitung bis zum ersten Start
OpenClaw Installationsleitfaden: Von der Umgebungsvorbereitung bis zum ersten Start
OpenClaw Cloud-Server vs. lokaler Betrieb: Die passende Deployment-Strategie wählen
Kommentare
Melde dich mit GitHub an, um einen Kommentar zu hinterlassen