言語を切り替える
テーマを切り替える

OpenClaw リモートコントロール完全ガイド:スマホを個人 AI OS のリモコンに変える

カフェにいるとき、自宅デスクトップ PC 上の PDF を急いで確認する必要が出ました。スマホを取り出し、Telegram の「ClawBot」に「デスクトップのスクリーンショットを見せて」と送信。10 秒後に届いた画像で PDF を確認し、「このファイルを開いて 3 ページ目の内容を教えて」と送ると、2 分後に要約が返ってきました。

正直、この半年こうした使い方は日常になりました。OpenClaw を個人 AI オペレーティングシステムとして構築してから、iPhone は本物の「リモコン」です。自宅 PC のカメラ起動、位置情報取得、リモートスクリーンショット——すべてオープンソースで、データは完全に自分の手元にあります。

メーカー機能の枠を超え、スマホを AI エージェントの操作盤にしたいなら、このOpenClaw リモートコントロールガイドはまさにあなた向けです。概念は抜きにして、すぐ実践に入りましょう。

低コスト「エビ飼育」ガイド:ArkClaw で AI Agent を本当に身近に

最近話題の OpenClaw(エビ)は便利ですが、設定のハードルが高い。ByteDance 火山引擎の ArkClaw はその敷居を一気に下げました。サーバーや Token 設定をいじらず、ワンクリックで 24 時間オンライン、ブラウザ操作・スクリプト実行・カレンダー管理ができる「AI 下請け」を手に入れられます。

何より安い:月額わずか 9.9 元。招待コード ZLKUK54M(こちらから登録)を使えば 8.9 元。プログラマーなら Coding Plan Pro に入ると無料で使える特典もあります。

OpenClaw ゲートウェイプロトコルの理解(Layer 1 基礎)

スマホを OpenClaw のリモコンにするには、まず仕組みを押さえます。「ゲートウェイプロトコル」という言葉に圧倒されないでください。異なるデバイスが互いを認識するための「合言葉」のセットです。

OpenClaw は Gateway WS Protocol(ゲートウェイ WebSocket プロトコル)を使います。名前は仰々しいですが、原理はシンプルです。PC のメイン制御端、スマホのノード、Telegram のチャット UI——すべてのデバイスが WebSocket 長接続で統一コントロールプレーンに接続し、接続時に「身元」と「能力」を報告します。

例えば iPhone は「iOS ノード。カメラ・スクリーンショット・位置情報が使える」と宣言します。PC は「ゲートウェイ。調整役」と。Telegram Bot は「クライアント。ユーザー指令を受け取る」と。

3 つの核心ロールを理解すれば、以降の設定はスムーズです。

Gateway(ゲートウェイ):システムの「頭脳」。メイン端末(通常 PC やサーバー)で動き、すべての指令を受け取り各ノードへ振り分けます。

Node(ノード):タスクを実行する端末。iPhone、Android、旧スマホも登録可能。各ノードは caps(能力)を宣言します。例:camera(カメラ)、screen(スクリーンショット)、location(位置情報)、voice(音声)。

Client(クライアント):指令を送る UI。Telegram、Discord、専用 iOS App、Web UI など。

ここで「スマホにこんな権限を開放して安全なの?」と思うかもしれません。

率直に言うと、これが私の最初の懸念でした。OpenClaw は Token 認証、デバイス署名、TLS 暗号化に加え、きめ細かい権限制御を備えています。ノードが「カメラ能力あり」と宣言しても、ゲートウェイ側で「このクライアントはスクリーンショットのみ、カメラ不可」と制限できます。

[画像:OpenClaw ゲートウェイプロトコルアーキテクチャ図。Gateway・Node・Client の関係]
プロンプト:技術アーキテクチャ図, Gateway 中心ノードが複数の iOS/Android デバイスに接続, 青系テックスタイル, シンプルで明確, high quality

設定時、ノード接続パラメータに次の JSON が見えます。

{
  "role": "node",
  "caps": ["camera", "screen", "location"],
  "commands": ["camera.snap", "screen.record", "location.get"],
  "permissions": {
    "camera.capture": true,
    "screen.record": false
  }
}

意味は明確です。このノードは撮影・スクリーンキャプチャ・位置取得が可能ですが、実際の利用可否はゲートウェイ権限次第。ノードが侵害されても、攻撃者の行動範囲は限定的です。

モバイルノード設定の実践(Layer 2 応用)

原理がわかったら手を動かします。iOS と Android で手順が大きく異なるため、分けて説明します。

iOS ノード設定

OpenClaw は App Store 未公開のため、TestFlight(内測資格があれば)か IPA 自己署名が必要です。私は AltStore で月 1 回再署名しており、大きな手間ではありません。

インストール後、ノード設定画面で次を正確に入力します。

Gateway URL:ゲートウェイの WebSocket アドレス。LAN テストなら ws://192.168.1.100:8080。外部アクセスはリバースプロキシで wss:// を使います。私は Cloudflare Tunnel で公開 IP を露出していません。

Client ID:ノード名。例:「iphone-15-main」。

Auth Token:ゲートウェイで生成した認証トークンを貼り付け。

Capabilities:開放する能力を選択。初回は location のみを推奨し、通ったら camerascreen を追加。最初から全開放すると障害切り分けが難しくなります。

接続後、緑の「Connected」が出ればノードはゲートウェイに登録完了です。

iOS の落とし穴はバックグラウンド制限です。バックグラウンド放置でプロセスが kill されることがあります。「バックグラウンド App 更新」の有効化か、時々アプリを開いて活性維持が必要です。私はサブ端末にノードを載せ、メイン端末は通常利用しています。

Android ノード設定

Android は柔軟です。公式 APK か Termux の Node 版を選べます。

APK は iOS と同様に、インストール→設定→接続。バックグラウンド制限は iOS より緩い一方、Huawei・Xiaomi・OPPO など国産 ROM は「バックグラウンド実行を許可」を手動設定しないと凍結されます。

Termux 案はカスタマイズ向き。Node.js を入れ npm install openclaw で CLI 起動。ログが詳細で障害調査に有利ですが、Termux:Boot や Tasker などの常駐対策が必要です。

[画像:Android Termux で OpenClaw ノード実行中のスクリーンショット]
プロンプト:スマホ画面, Termux ターミナルに OpenClaw ノード接続成功ログ, ダークモード, 緑文字, high quality

iOS/Android 共通の原則は最小権限です。位置情報とたまのスクリーンショットだけならカメラは不要。権限を絞るほど攻撃面は縮小します。

もう一点、デバイス署名。鍵ペアを生成し公開鍵をゲートウェイ、秘密鍵をノードに置けば、Token 漏洩だけでは接続できません。私のゲートウェイは署名を必須にしています。

Telegram リモートコントロール実践

ノード接続後、どう操作するか。最も直接的なのは Telegram です。追加 App 不要で、開くだけ使えるのが好みです。

@BotFather で Bot を作成し Token を取得。OpenClaw の channel 設定に Telegram プラグインを追加して Token を入力、ゲートウェイを再起動すれば Bot が稼働します。

channels:
  telegram:
    token: "YOUR_BOT_TOKEN"
    mode: polling

Polling は個人利用向けで手軽。Webhook は公開 HTTPS が必要ですが応答は速いです。

Bot 接続後、OpenClaw はデフォルトでメッセージを AI に転送しますが、ここではハードウェアのリモート制御が目的なので、専用コマンド形式を使います。

skills 設定でノード能力にコマンドをバインドします。

skills:
  remote_control:
    commands:
      camera:
        target: "iphone-15-main"
        action: "camera.snap"
      screenshot:
        target: "iphone-15-main"
        action: "screen.capture"
      where:
        target: "iphone-15-main"
        action: "location.get"

設定後、Telegram で /camera と送れば指定 iPhone が撮影して返信します。/where で GPS 座標が返ります。

初めて自宅スマホから写真が返ってきたとき、本当にワクワクしました。常時待機の助手が増えた感覚——しかも完全に自分のものです。

[画像:Telegram 対話。/camera コマンドと返信写真]
プロンプト:Telegram チャット画面, ユーザーが /camera 送信, Bot が撮影写真を返信, スマホ UI, 中国語, high quality

Telegram はグループにも対応。自分専用グループに Bot を入れると履歴管理が楽です。家族共有も可能ですが、権限設定は慎重に——夜中にスクリーンショットを撮られる経験は聞かないでください。

Telegram から Bot に画像やドキュメントを送ることもできます。自宅のサブ端末に画像を送り、OpenClaw に分析や保存をさせる——ある種の「クロスデバイスクリップボード」です。

専用 App と応用シナリオ

Telegram は便利ですが、チャット UI ゆえに不向きな場面もあります。自宅カメラを素早く確認したい、全ノード状態を一覧したい——その場合は専用 App が有効です。

OpenClaw 公式 Web UI はデフォルトで http://localhost:3000。スマホブラウザでダッシュボードを開けますが、外部アクセスにはリバースプロキシが必要です。

私は Nginx + HTTP Basic Auth で外部公開し、ブックマークして使っています。オンラインノード、能力ステータス、最新ログを確認でき、ノードをクリックして Camera ボタンで手動撮影も可能です。

コミュニティには ClawDash など第三方パネルもあり、レイアウトカスタマイズやホームに常用ボタン配置ができます。ただしゲートウェイ接続ツールなので、安全性は自己評価が必要です。

自動化ワークフロー

より高度な使い方:自動化。OpenClaw はイベントトリガーでスキル実行が可能です。

例:ジオフェンス。携帯ノードが「自宅」範囲に入ると、自宅 PC が「音楽プレイヤーを開く」を自動実行。帰宅時にはすでに音楽が流れています。

別例:定期スクリーンショット。サブ Android を毎朝 8 時にキャプチャさせ、AI が異常(家電の消し忘れなど)を検知したら Telegram で通知します。

設定ファイルの例:

automations:
  - name: "arrive_home"
    trigger:
      type: "geofence"
      device: "iphone-15-main"
      location: "home"
    action:
      target: "macbook-pro"
      skill: "music.play"
  - name: "morning_check"
    trigger:
      type: "schedule"
      cron: "0 8 * * *"
    action:
      target: "android-spare"
      skill: "screen.analyze"

トラブルシューティング

設定中に踏みがちな落とし穴です。

ゲートウェイ接続不可:WebSocket アドレスとポートを確認。curl ws://gateway-ip:port でテスト。wss なら証明書を確認。

ノードオフラインだが App は接続済みrole"client" になっていないか確認。正しくは "node" です。

コマンド無応答:ゲートウェイログでルーティング先を確認。デバイス ID 誤りで存在しないノードに送っていることがあります。

権限拒否:ノードの permissions とゲートウェイ権限ポリシーを確認。OpenClaw の権限は双方向で、ノード宣言とゲートウェイ許可の両方が必要です。

まとめ

要点は 3 つです。

第一、OpenClaw の Gateway Protocol は統一デバイス接続標準を提供し、スマホと PC を同一コントロールプレーンで対話させます。黒魔術ではなく、WebSocket とロール/能力宣言の仕組みです。

第二、スマホをノード化すれば、携行センサー兼実行端末を得ます。カメラ・位置・画面——スマホ専用だったハードウェアを AI エージェントから呼び出せます。

第三、Telegram や専用 App を UI にすれば、どこからでも自宅 AI に指令できます。データと決定権が完全に自分の手元にある点で、クラウド型スマートアシスタントより実用的です。

まだ試していないなら、今夜サブ端末を見つけ第 2 章の手順で設定してみてください。「リモート撮影」だけでも、どこからでも目を持つ感覚は新鮮です。

コミュニティは OpenClaw を継続改善し、新スキルと統合が増え続けています。今は Layer 2 のハードウェア制御ですが、将来はさらに広がるでしょう。

少なくとも今、私のスマホはスマホ以上の存在——AI OS のリモコンです。あなたのもそうなれます。

OpenClaw モバイルノード設定の完全手順

iOS または Android を OpenClaw ノードとして設定する詳細手順。ゲートウェイ接続、権限設定、Telegram Bot 制御を含む

⏱️ 目安時間: 30 分

  1. 1

    ステップ1: 準備:OpenClaw ノードアプリのインストール

    iOS ユーザー:
    • TestFlight または AltStore で自己署名し、OpenClaw iOS クライアントをインストール
    • ノードをオンライン維持するため「バックグラウンド App 更新」を有効化

    Android ユーザー:
    • 案 A:公式 APK をインストールし「バックグラウンド実行を許可」
    • 案 B:Termux で npm install openclaw を実行

    注意:サブ端末の方が長期ノード運用に向く。メイン端末はバックグラウンド制限の影響を受けやすい
  2. 2

    ステップ2: ノード接続パラメータの設定

    主要フィールド:
    • Gateway URL:ws://LAN IP:ポート または wss://公開ドメイン
    • Client ID:一意 ID(例:"iphone-15-main")
    • Auth Token:ゲートウェイで生成した認証トークン
    • Capabilities:必要に応じて location/camera/screen を選択

    セキュリティ推奨:
    • デバイス鍵ペアを生成し、公開鍵をゲートウェイ、秘密鍵をノードに保管
    • 初回は location のみ開放し、テスト後に他権限を追加
    • 最小権限の原則で攻撃面を縮小
  3. 3

    ステップ3: Telegram Bot 制御の設定

    Bot 作成:
    • Telegram で @BotFather に連絡し /newbot を実行
    • 取得した Bot Token を保存

    OpenClaw 設定:
    • channels に telegram プラグインを追加
    • mode は polling(個人利用)または webhook(高速応答)
    • skills でコマンドをノード能力にバインド(例:/camera → camera.snap)

    テストコマンド:
    • /camera - リモート撮影
    • /where - 位置情報取得
    • /screenshot - 画面キャプチャ
  4. 4

    ステップ4: 応用:自動化ワークフローの設定

    ジオフェンストリガー:
    • 特定エリアへの進入/退出時にスキルを自動実行
    • 例:帰宅時に音楽を自動再生

    定期タスク:
    • cron 式でスケジュール起動
    • 例:毎朝 8 時にスクリーンショットで確認

    トラブルシューティング:
    • ゲートウェイ接続不可:WebSocket アドレスと TLS 証明書を確認
    • ノードオフライン:role が "node" で "client" ではないか確認
    • コマンド無応答:ゲートウェイログでルーティングを確認

FAQ

OpenClaw ノード設定に必要な技術レベルは?
ハードルは高くありません:
• 基本的な CLI 操作
• WebSocket と Token 認証の概念理解
• yaml ファイルの編集

iOS ユーザーは TestFlight や自己署名インストールに慣れているとよいです。Android で Termux を使う場合は基本的な Linux コマンドが必要です。一般的な開発者なら 30 分以内で設定完了できます。
スマホをノードにするとバッテリー消費は激しい?
設定次第です:
• location のみ:消費は極めて低く、ほぼ気にならない
• camera と screen:使用時のみ消費、平常時は影響小
• WebSocket 長接続:ハートビートの消費はごくわずか

推奨:サブ端末でノード常駐、または必要時のみ起動。iOS はバックグラウンド制限、Android は各社の省電力設定に注意。
OpenClaw リモート制御は安全?
セキュリティ設計は充実しています:
• Token 認証:接続時に有効トークン必須
• デバイス署名:公開鍵/秘密鍵検証で Token 漏洩後のなりすましを防止
• TLS 暗号化:外部アクセスは wss で通信を暗号化
• 細粒度権限:ノードが能力を宣言し、ゲートウェイがクライアント呼び出しを制御
• ローカル展開:データは第三者サーバーを経由せず自己管理

ベストプラクティス:デバイス署名の強制 + 最小権限 + Token の定期更新。
Telegram Bot と専用 App、どちらが使いやすい?
それぞれ長所・短所があります:

Telegram Bot:
• メリット:追加 App 不要、どこでも使える、グループ共有可能
• デメリット:チャット UI は直感的でなく、複雑操作に不向き

専用 App / Web UI:
• メリット:ビジュアル UI、ワンクリック起動、ノード状態の確認が容易
• デメリット:外部アクセスにリバースプロキシが必要、追加 App の場合も

日常利用は Telegram Bot で十分。複雑・高頻度操作は Web UI を推奨。
スマホ以外に制御できるデバイスは?
OpenClaw が動くデバイスなら理論上すべて可能:
• PC(macOS/Windows/Linux):メインゲートウェイまたは他ノード
• Raspberry Pi:低消費電力で長期稼働に最適
• Android TV / TV ボックス:自宅メディアセンターのリモコン
• 旧スマホ/タブレット:監視専用ノードに改造

制約は Node.js 実行または OpenClaw クライアントの存在と WebSocket 接続。コミュニティの発展で対応デバイスは増え続けます。

5分で読めます · 公開日: 2026年2月26日 · 更新日: 2026年6月8日

関連記事

コメント

GitHubアカウントでログインしてコメントできます