Sprache wechseln
Design wechseln

OpenClaw Fernsteuerung: Ihr Smartphone als persönliche KI-Betriebssystem-Fernbedienung

Im Café – dringende Aufgabe, aber die PDF liegt auf dem Desktop zu Hause. Smartphone raus, Telegram-Nachricht an „ClawBot“: „Mach einen Screenshot vom Desktop.“ Zehn Sekunden später: Desktop-Bildschirmfoto, PDF-Datei sichtbar. Nächste Nachricht: „Öffne die Datei und fass Seite drei zusammen.“ Zwei Minuten später: Zusammenfassung der dritten Seite.

Solche Szenarien sind für mich in den letzten Monaten Alltag geworden. Seit OpenClaw als persönliches KI-Betriebssystem läuft, ist mein iPhone eine echte Fernbedienung – Heim-PC-Kamera, Standort, Remote-Screenshots. Alles mit Open-Source-Tools, Daten vollständig bei mir.

Wenn Sie Ihr Smartphone zur echten Steuerzentrale Ihres KI-Agenten machen wollen – statt in Hersteller-Funktionen gefangen zu sein – ist dieser OpenClaw-Fernsteuerungs-Leitfaden für Sie. Keine Theorie, direkt zur Praxis.

Günstiger Einstieg: ArkClaw macht KI-Agenten zugänglich

OpenClaw (der „Hummer“) ist mächtig, aber die Einrichtung abschreckend? ByteDance Volcano Engine bietet ArkClaw mit minimalem Aufwand: ohne Server- und Token-Konfiguration einen 24/7-online Agent mit Browser-, Skript- und Kalendersteuerung.

Preis: 9,9 Yuan/Monat; mit Einladungscode ZLKUK54M (hier registrieren) 8,9 Yuan. Entwickler: Coding Plan Pro inklusive.

Das OpenClaw-Gateway-Protokoll verstehen (Layer 1 – Grundlagen)

Um Ihr Smartphone zur OpenClaw-Fernbedienung zu machen, sollten Sie verstehen, wie das System arbeitet. „Gateway-Protokoll“ klingt technisch – im Kern geht es um eine gemeinsame Sprache, mit der Geräte sich erkennen.

OpenClaw nutzt das Gateway WS Protocol (Gateway-WebSocket-Protokoll). Alle Geräte – Hauptsteuerung am PC, Node auf dem Smartphone, Chat-Oberfläche in Telegram – hängen über eine persistente WebSocket-Verbindung an einer einheitlichen Steuerungsebene. Jedes Gerät meldet Identität und Fähigkeiten beim Verbinden.

Beispiel: Ihr iPhone meldet: „Ich bin ein iOS-Node mit Kamera, Screenshot und Standort.“ Der PC: „Ich bin das Gateway und koordiniere.“ Der Telegram Bot: „Ich bin Client und nehme Befehle entgegen.“

Drei Kernrollen – wenn Sie diese verstehen, wird die Konfiguration einfacher:

Gateway: Das „Gehirn“ des Systems, typischerweise auf PC oder Server. Alle Befehle laufen hier ein und werden an Nodes verteilt.

Node: Gerät, das konkrete Aufgaben ausführt. iPhone, Android oder ein altes Smartphone als Node. Jeder Node deklariert caps (Capabilities), z. B. camera, screen, location, voice.

Client: Oberfläche zum Senden von Befehlen – Telegram, Discord, iOS-App oder Web-UI.

Die Frage: Ist es sicher, dem Smartphone so viele Rechte zu geben?

Das war auch meine erste Sorge. OpenClaw adressiert das: Token-Authentifizierung, Gerätesignatur, TLS-Verschlüsselung. Entscheidend: feingranulare Rechte – der Node kann „Kamera verfügbar“ melden, das Gateway kann „dieser Client darf nur Screenshot, nicht Kamera“ erlauben.

[Bild: OpenClaw-Gateway-Protokoll – Gateway, Node, Client]
Prompt: Technisches Architekturdiagramm, Gateway als Zentrum mit iOS- und Android-Geräten, blauer Tech-Stil, klar und übersichtlich, high quality

In der Node-Konfiguration sehen Sie typischerweise:

{
  "role": "node",
  "caps": ["camera", "screen", "location"],
  "commands": ["camera.snap", "screen.record", "location.get"],
  "permissions": {
    "camera.capture": true,
    "screen.record": false
  }
}

Bedeutung: Der Node kann fotografieren, Screenshots und Standort – ob das Gateway es erlaubt, steht in permissions. Selbst bei Kompromittierung bleibt der Schaden begrenzt.

Mobile Node-Konfiguration in der Praxis (Layer 2 – Fortgeschritten)

Nach dem Protokoll folgt die Umsetzung – getrennt für iOS und Android.

iOS-Node-Konfiguration

OpenClaw ist nicht im App Store – TestFlight (bei Beta-Zugang) oder Self-Signed IPA, z. B. mit AltStore (monatliche Neusignierung).

Nach der Installation: Node-Konfiguration. Wichtige Felder:

Gateway URL: WebSocket-Adresse des Gateways. Im LAN z. B. ws://192.168.1.100:8080. Extern: Reverse Proxy mit wss://. Ich nutze Cloudflare Tunnel – ohne öffentliche IP.

Client ID: Eindeutiger Name, z. B. „iphone-15-main“.

Auth Token: Vom Gateway generiertes Token einfügen.

Capabilities: Gewünschte Fähigkeiten aktivieren. Beim ersten Mal nur location, danach camera und screen – nicht alles auf einmal.

Verbinden – grüner „Connected“-Status bedeutet: Node hängt am Gateway.

iOS-Hintergrundlimit: Apps werden im Hintergrund beendet. Lösungen: „Hintergrundaktualisierung“ aktivieren oder gelegentlich die App öffnen. Ich lasse den Node auf einem Ersatzgerät laufen.

Android-Node-Konfiguration

Flexibler: offizielles APK oder Node-Version in Termux.

APK wie bei iOS: installieren, konfigurieren, verbinden. Android-Hintergrund ist toleranter. Bei Huawei, Xiaomi, OPPO usw. „Hintergrundausführung erlauben“ manuell setzen.

Termux für Tüftler: Node.js, npm install openclaw, Node per CLI starten – detaillierte Logs, aber Hintergrund-Kill; Termux:Boot und Tasker helfen beim Keep-Alive.

[Bild: OpenClaw-Node in Termux auf Android]
Prompt: Smartphone-Screenshot, Termux mit erfolgreichem OpenClaw-Node-Log, Dark Mode, grüner Text, high quality

Sicherheit auf beiden Plattformen: Prinzip der minimalen Rechte. Brauchen Sie wirklich die Kamera? Nur Standort und gelegentlicher Screenshot – Kamera weglassen.

Gerätesignatur: Schlüsselpaar erzeugen, Public Key ins Gateway, Private Key auf dem Node. Token allein reicht nicht – ich erzwinge Signatur am Gateway.

Telegram-Fernsteuerung in der Praxis

Node online – wie steuern? Am direktesten: Telegram. Keine Extra-App, Telegram öffnen und los.

Bot bei @BotFather anlegen, Token erhalten. In OpenClaws channels Telegram-Plugin mit Token eintragen, Gateway neu starten – Bot lebt.

channels:
  telegram:
    token: "YOUR_BOT_TOKEN"
    mode: polling

Polling ist am einfachsten für Privatnutzer. Webhook braucht öffentliche HTTPS-URL, reagiert aber schneller.

Standardmäßig leitet OpenClaw Nachrichten an die KI – für Remote-Hardware brauchen Sie explizite Befehle.

In skills Fähigkeiten an Befehle binden:

skills:
  remote_control:
    commands:
      camera:
        target: "iphone-15-main"
        action: "camera.snap"
      screenshot:
        target: "iphone-15-main"
        action: "screen.capture"
      where:
        target: "iphone-15-main"
        action: "location.get"

Danach: /camera in Telegram → Foto vom iPhone. /where → GPS-Koordinaten.

Als das erste Remote-Foto ankam, war das ein starker Moment – ein eigener Assistent, komplett unter Ihrer Kontrolle.

[Bild: Telegram mit /camera und zurückgesendetem Foto]
Prompt: Telegram-Chat, Nutzer sendet /camera, Bot antwortet mit Foto, Mobil-UI, high quality

Telegram-Gruppen: Bot in private Gruppe – bessere Historie. Familienfreigabe möglich – Rechte sauber setzen (Nacht-Screenshots vermeiden …).

Bilder und Dokumente an den Bot: OpenClaw kann analysieren oder in ein Verzeichnis speichern – quasi geräteübergreifende Zwischenablage.

Dedizierte App und fortgeschrittene Szenarien

Telegram ist praktisch, aber als Chat-Oberfläche limitiert – schneller Kamera-Blick oder Node-Übersicht brauchen oft mehr.

OpenClaw Web UI standardmäßig unter http://localhost:3000 – Dashboard im mobilen Browser. Extern: Reverse Proxy.

Ich nutze Nginx mit HTTP Basic Auth, Lesezeichen im Browser – online Nodes, Capabilities, Logs; manuell Camera klicken → Foto vom Phone.

Community-Tools wie ClawDash mit Custom-Layouts – Sicherheit selbst prüfen, da sie ans Gateway connecten.

Automatisierungs-Workflows

Event-getriggerte Skills – z. B. Geofence: Wenn mein Phone-Node „Zuhause“ betritt, startet der Heim-PC die Musik.

Geplanter Screenshot: Ersatz-Android täglich 8 Uhr – KI prüft Anomalien (Gerät vergessen?), Telegram-Alert bei Bedarf.

Beispiel-Konfiguration:

automations:
  - name: "arrive_home"
    trigger:
      type: "geofence"
      device: "iphone-15-main"
      location: "home"
    action:
      target: "macbook-pro"
      skill: "music.play"
  - name: "morning_check"
    trigger:
      type: "schedule"
      cron: "0 8 * * *"
    action:
      target: "android-spare"
      skill: "screen.analyze"

Fehlerbehebung

Typische Stolpersteine:

Keine Gateway-Verbindung: WebSocket-URL und Port prüfen, curl ws://gateway-ip:port testen. Bei wss: Zertifikat validieren.

Node offline, App zeigt verbunden: Oft falsche role – muss "node" sein, nicht "client".

Befehl ohne Reaktion: Gateway-Logs – Routing und Device-ID prüfen.

Permission denied: Node-permissions und Gateway-Policy – beide Seiten müssen zustimmen.

Fazit

Kurz drei Punkte:

Erstens: OpenClaw Gateway Protocol ist ein einheitlicher Standard für Geräteverbindungen – Smartphone und PC auf einer Steuerungsebene. WebSocket plus klare Rollen- und Capability-Deklaration.

Zweitens: Smartphone als Node = mobiler Sensor und Executor. Kamera, Standort, Bildschirm – Hardware-Fähigkeiten für Ihren KI-Agenten.

Drittens: Telegram oder dedizierte App als Steuerung – von überall Befehle ans Heim-System. Daten und Entscheidungen bleiben bei Ihnen – greifbarer als viele Cloud-Assistenten.

Mein Rat: Heute Abend ein Ersatz-Smartphone nach Kapitel zwei einrichten – selbst nur Remote-Foto vermittelt das Gefühl, „überall Augen“ zu haben.

Die Open-Source-Community erweitert OpenClaw ständig. Layer 2 ist Hardware-Steuerung – mehr kommt. Wer weiß.

Mein Phone ist längst mehr als ein Phone – Fernbedienung meines KI-Betriebssystems. Ihres kann es auch werden.

Vollständiger Ablauf: OpenClaw-Mobilgerät als Node konfigurieren

Detaillierte Schritte, um ein iOS- oder Android-Gerät als OpenClaw-Node einzurichten – Gateway-Verbindung, Berechtigungen und Telegram-Bot-Steuerung

⏱️ Estimated time: 30 min

  1. 1

    Step1: Vorbereitung: OpenClaw-Node-App installieren

    iOS-Nutzer:
    • OpenClaw-iOS-Client per TestFlight oder AltStore-Self-Signing installieren
    • „Hintergrundaktualisierung“ aktivieren, damit der Node online bleibt

    Android-Nutzer:
    • Variante A: Offizielles APK installieren, „Hintergrundausführung erlauben“ setzen
    • Variante B: In Termux `npm install openclaw` ausführen

    Hinweis: Ein Ersatzgerät eignet sich besser für dauerhaft laufende Nodes; Hauptgeräte können durch Hintergrundlimits beeinträchtigt werden
  2. 2

    Step2: Node-Verbindungsparameter konfigurieren

    Wichtige Felder:
    • Gateway URL: ws://LAN-IP:Port oder wss://öffentliche-Domain
    • Client ID: Eindeutige Kennung, z. B. „iphone-15-main“
    • Auth Token: Vom Gateway generiertes Authentifizierungs-Token
    • Capabilities: Nach Bedarf location/camera/screen aktivieren

    Sicherheitsempfehlungen:
    • Zuerst Geräteschlüsselpaar erzeugen – Public Key ins Gateway, Private Key auf dem Node
    • Beim ersten Setup nur location freigeben, weitere Berechtigungen nach erfolgreichem Test
    • Prinzip der minimalen Rechte – kleinere Angriffsfläche
  3. 3

    Step3: Telegram-Bot-Steuerung einrichten

    Bot erstellen:
    • In Telegram @BotFather kontaktieren, /newbot ausführen
    • Erhaltenes Bot Token sichern

    OpenClaw konfigurieren:
    • Telegram-Plugin in channels hinzufügen
    • mode: polling (privat) oder webhook (schnellere Reaktion)
    • In skills Befehle an Node-Fähigkeiten binden, z. B. /camera → camera.snap

    Testbefehle:
    • /camera – Remote-Foto
    • /where – Standort abfragen
    • /screenshot – Bildschirmfoto
  4. 4

    Step4: Fortgeschritten: Automatisierungs-Workflows

    Geofence-Trigger:
    • Skills automatisch ausführen beim Betreten/Verlassen einer Zone
    • Beispiel: Zu Hause automatisch Musik abspielen

    Geplante Tasks:
    • Mit Cron-Ausdruck zeitgesteuert auslösen
    • Beispiel: Täglich um 8 Uhr Screenshot zur Kontrolle

    Fehlerbehebung:
    • Keine Gateway-Verbindung: WebSocket-Adresse und TLS-Zertifikat prüfen
    • Node offline: role muss „node“ sein, nicht „client“
    • Keine Befehlsreaktion: Gateway-Logs prüfen, ob Routing korrekt ist

FAQ

Welche technischen Vorkenntnisse braucht die OpenClaw-Node-Konfiguration?
Anforderungen sind moderat:
• Grundlegende Kommandozeilen-Nutzung
• Verständnis von WebSocket und Token-Authentifizierung
• YAML-Dateien konfigurieren können

iOS-Nutzer sollten TestFlight oder Self-Signing kennen. Android-Nutzer mit Termux brauchen grundlegende Linux-Befehle. Mit typischem Entwickler-Niveau ist die Einrichtung in etwa 30 Minuten machbar.
Verbraucht ein Smartphone als Node viel Akku?
Der Verbrauch hängt von der Konfiguration ab:
• Nur location: sehr gering, kaum spürbar
• camera und screen: nur bei Nutzung, im Idle kaum relevant
• WebSocket-Dauerverbindung: Heartbeat verbraucht wenig Strom

Empfehlung: Ersatzgerät als Node, Hauptgerät normal nutzen. Oder Node nur bei Bedarf aktivieren. iOS: Hintergrundlimits beachten; Android: Energiesparmodus anpassen.
Ist OpenClaw-Fernsteuerung sicher?
Das Sicherheitsdesign ist solide:
• Token-Authentifizierung bei der Verbindung
• Gerätesignatur mit Public-/Private-Key gegen Token-Missbrauch
• TLS-Verschlüsselung bei wss für externen Zugriff
• Feingranulare Rechte: Node deklariert Fähigkeiten, Gateway steuert Client-Aufrufe
• Self-Hosting: Keine Daten über Drittanbieter – volle Kontrolle

Best Practice: Gerätesignatur erzwingen + minimale Rechte + Token regelmäßig rotieren.
Telegram Bot oder dedizierte App – was ist praktischer?
Beides hat Vor- und Nachteile:

Telegram Bot:
• Vorteile: Keine Extra-App, überall verfügbar, Gruppenfreigabe
• Nachteile: Chat-Oberfläche weniger intuitiv, komplexe Aktionen umständlich

Dedizierte App / Web UI:
• Vorteile: Visuelle Oberfläche, One-Click-Aktionen, Node-Status auf einen Blick
• Nachteile: Reverse Proxy für externen Zugriff, ggf. zusätzliche App

Empfehlung: Telegram Bot für den Alltag; Web UI bei komplexen oder häufigen Aktionen.
Welche Geräte lassen sich außer dem Smartphone noch steuern?
Theoretisch jedes Gerät mit OpenClaw:
• Computer (macOS/Windows/Linux): als Gateway oder Node
• Raspberry Pi: ideal für dauerhaften Low-Power-Betrieb
• Android TV / TV-Box: Media Center remote steuern
• Alte Smartphones/Tablets: als dedizierter Monitor-Node

Voraussetzung: Node.js oder OpenClaw-Client plus WebSocket. Mit der Community wächst die Geräteliste.

6 Min. Lesezeit · Veröffentlicht am: 26. Feb. 2026 · Aktualisiert am: 20. Juni 2026

Ähnliche Beiträge

Kommentare

Melde dich mit GitHub an, um einen Kommentar zu hinterlassen