AI News HubLIVE
サイト内リライト6 分で読了

Claude Dispatchとインターフェースの力

AIの能力は一般に認識されているよりもはるかに高いが、ほとんどのユーザーはチャットボット経由でのみアクセスしており、これが認知負荷を生んでいる。この記事では、プログラミングエージェント(Claude Code)、Googleの実験的ツール、そしてOpenClawやClaude Coworkのようなパーソナルエージェントが、より良いインターフェースを通じてAIの可能性を引き出す方法を探る。

ソースOne Useful Thing著者: Ethan Mollick

AIはすでにほとんどの人が気づいているよりもはるかに有能です。いわゆる「能力の過剰」の大部分は、AIの限界(もちろん多くの限界はまだあります)ではなく、人々がAIと対話する方法に起因しています。大多数の人はチャットボットを通じてAIにアクセスしており、通常は能力の低いモデルの無料版を使っています。チャットボットは簡単な質問には適していますが、実際の仕事をするには不向きな方法です。

実際、最近の研究では、チャットボットインターフェースを仕事に使うと「精神的な税」が発生することが示されています。新しい論文では、少数の金融専門家にGPT-4o1で複雑な評価タスクを実行させ、その認知的負荷を会話記録から測定しました。人々はAIによる生産性向上を実感しましたが、その一部はAIが情報を提示する方法(巨大なテキストの壁、新しいトピックの提案、広範な議論)によって打ち消されていました。チャットボットインターフェースが障害であり、仕事自体ではないように見えました。会話が乱雑になると、そのままでした。AIは役立つように最適化されており、ユーザーが提供する乱雑な構造をそのまま反映し、圧倒されたユーザーは再整理しませんでした。両者が問題を悪化させ続けました。最も被害を受けたのは経験の浅いワーカーであり、まさにAIから最も恩恵を受けるはずの人々でした(もし自分が何をしているかを把握できていれば)。

これを知っていても驚くことではありません。チャットボットで仕事をしたことがあれば、具体的な質問をして、(どこかに!)答えを含む5つの段落を得ると同時に、AIが尋ねてもいない3つの新しいことを提案するという経験があるでしょう。インターフェース自体が認知コストを生み出し、AIの知能の利点を圧倒しています。では、より良いインターフェースとはどのようなものでしょうか?

特化型インターフェース 一つの選択肢は、特定の仕事やタスクに特化したインターフェースを構築することです。特化型AIインターフェースの中で、本当に完成しているのはプログラミング用だけです。これは予想通りです。AIラボはプログラマーによって運営され、モデルはコードで広範に訓練され、これらのツールを構築する人々はしばしば自分自身のために構築しています。

私は以前、AnthropicのコーディングエージェントであるClaude Codeについて書きました。これは自律的に何時間も作業できます。OpenAIのCodexやGoogleのAntigravityも同様のことを行います。私はClaude Codeを使って、お金を稼ぐ(わずかですが)ことからゲームを作ることまで、一切コードに触れずに行ってきました。また、Codexも同様の能力で非常に有用だと感じています。これらのツールは素晴らしいですが、実際にはプログラマー向けに作られています。PythonとGitを知っていることを前提としています。インターフェースは1980年代のコンピュータ室のように見えます。開発者ではない99%のナレッジワーカーにとって、これらの強力なAIツールは最適化されていません。

Pomelli、Stitch、NotebookLM すべてのAIラボの中で、Googleは他の職業向けに特化したインターフェースを構築する実験を最も行っているようです。どれも少し粗削りですが、AIツールが他の種類のナレッジプロフェッショナル向けに構築された場合の未来を示しています。GoogleのStitchは、AIネイティブなデザインがどのように見えるかを示唆しています。自然言語でアプリを説明すると、一貫したデザインシステムを持つ複数の相互接続された画面が得られます。同様に、PomelliはウェブサイトのURLを貼り付けると、ブランドに合ったソーシャルメディアキャンペーンを自動生成し、マーケティングの言語(プロンプトではなく)を使用して技術的でない感じにしています。そして最も有名なNotebookLMは、多様な情報源を調査、表示、操作する方法を提供します。これらのそれぞれが将来の方向性を示していますが、プログラマーにとってのClaude Codeのような変革的なツールにはまだなっていません。しかし、爆発的に成長している別のインターフェースがあります。パーソナルエージェントです。

既存のインターフェースを利用する もし聞いたことがなければ、OpenClawはオープンソースのAIエージェントであり、シンボルは赤いロブスターで、セキュリティ上の悪夢であり、歴史上最も速く成長したオープンソースプロジェクトになっています。OpenClawが成功したのは、それが真のパーソナルエージェントだからです。このシステムは、WhatsAppやTelegram、Slackなどを通じてAIエージェントと会話できるように設計されており、これらは人とテキストをやり取りするのと同じアプリです。メールをチェックして、テーブルを予約して、ファイルを探して、と指示すると、エージェントがコンピュータ上で実行します。これはインターフェース問題を、後から見れば明白な方法で解決しました。チャットボットやコマンドラインではなく、すでに使い慣れたインターフェース(WhatsAppなど)を使って、人間と話すようにAIと会話できるようにしたのです。

しかし、OpenClawは使いにくく、多くのセキュリティリスクをもたらします。Anthropicの回答は、Dispatchを備えたClaude Coworkです。1月にリリースされたCoworkは、ナレッジワーカー向けのClaude Codeのバージョンです。デスクトップワークスペースを通じてClaudeにローカルファイルやアプリケーションへのアクセスを提供します。また、コネクタを通じて数十のアプリに接続し、コネクタがない場合はマウスとキーボードの直接制御にフォールバックします。Dispatchはここ数週間で追加された重要なピースです。あなたのデスクトップで作業している間に、携帯電話からClaudeにメッセージを送信できます。QRコードをスキャンすると、携帯電話がコンピュータに座っているAIエージェントのリモートコントロールになります。

DispatchとClaude Codeを組み合わせることで、有能なアシスタントと話しているようなインターフェースが生まれます。例えば、携帯電話からClaudeに朝のブリーフィングを準備するよう依頼すると、カレンダー、メール、オンラインチャンネルを読み取り、次に何をすべきかのレポートをくれます。しかしCoworkはより複雑な作業も行います。携帯電話から、最近のプレゼンテーションを見て、スライド3のグラフが最新かどうか確認し、もし違えば更新するよう依頼しました。ある場所で少し詰まっているのが見えます(あるサイトがファイルのダウンロードをブロックしました)が、それを除けば結果は非常に印象的でした。PowerPointを開いて「表示」し、コンピュータ全体をより新しいデータがないか調査しました。より新しいオンラインペーパーのリンクを与えると、PDFをダウンロードし、新しいグラフを見つけ、グラフの画像を切り抜き、PowerPointを更新してくれました。これは洗練された複雑な作業であり、常にシームレスではないにしても、通常は十分に近く、多くの時間を節約できます。

これはOpenClawと同じくらい柔軟ですか?いいえ。Coworkはサンドボックス化されており、より安全ですが制限されています(しかしセキュリティリスクがないわけではありません)。コネクタエコシステムは成長していますが不完全です。そしてCoworkがあなたのコンピュータを使用できるというアイデアは、概念としては印象的ですが、実際にはエラーが発生しやすいです。しかし、核となる洞察はOpenClawが偶然見つけたものと同じです。人々はチャットボットを望んでいません。実際のファイルで、実際のツールを使って、人と話すようにアクセスできるエージェントを望んでいます。

オンデマンドインターフェース これらすべては、インターフェースを事前に決定する必要があることを前提としています。しかし、最新のAIシステムは実際にあなたのためにインターフェースを構築できます。例えば、ここ数週間でClaudeは会話の中で直接可視化を生成する能力を得ました。これらは静的な画像ではありません。インタラクティブで調整可能であり、Claudeはフォローアップの質問に応じて変更できます。

これはインターフェース問題への異なるアプローチです。企業があらゆる種類の仕事に特化したインターフェースを構築する代わりに、AIがその場で適切なインターフェースを生成します。未来は単一のインターフェースがすべてを支配するのではなく、AIがその瞬間に適したインターフェースを生成すること、つまりデスクトップ上のエージェント、会話の中のチャート、問題を解決するためのカスタムアプリになると私は考えます。私たちはAIのインターフェースに適応することから、AIがあなたにインターフェースを適応させることへと移行しています。

AIの能力はAIのアクセシビリティを先取りしてきました。モデルはしばらく前から非凡なことを行うのに十分賢くなっていましたが、私たちは人々にチャットボットを通じてその知能にアクセスさせてきました。そして、認知負荷の研究が示すように、チャットボット形式は積極的に彼らの妨げになっています。インターフェースが改善されるにつれて、より多くの人々が実際にAIの能力を使えるようになったときに何が起こるかを見ることになるでしょう。そのギャップの一部でも埋める新しいインターフェースは、モデルが変わっていなくても(それでも変化していますが)、AIの能力の飛躍のように感じられます。私の推測では、人々が時々表明する「AIへの失望」の多くは、AIが悪いからではなく、インターフェースが間違っているからです。私たちは近年の歴史の中で最も強力な技術の一つを構築し、それから人々にチャットウィンドウにタイプしてアクセスさせました。それはすぐに変わるでしょう。