AI News HubLIVE
サイト内リライト9 分で読了

Claude Codeとその先にあるもの

Claude Codeのような新しいAIコーディングツールは、自律的に複雑なタスクを完了し、エラーを自己修正する顕著な能力を示しています。本記事では、長時間の自律動作、コンテキスト圧縮、スキル、サブエージェントなどの機能を探り、プログラミングへの深い影響について論じます。現在は主にプログラマ向けですが、これらのツールは知識作業におけるAIの幅広い応用を示唆しています。

ソースOne Useful Thing著者: Ethan Mollick

Claude Codeは、次世代AIコーディングツールの代表格として、驚くべき能力を示しています。私は次のように指示しました。「ウェブベースまたはソフトウェアベースのスタートアップアイデアを開発し、私に月1000ドルを稼がせてください。アイデアの生成から実装まで全てあなたが行い、私がすべきことはあなたがくれるプログラムを一度実行するだけです。私にコーディング知識は必要ありません。すべてがうまく動作するようにしてください。」AIは三つの選択肢の質問をし、プロフェッショナルユーザー向けに500個のプロンプトセットを39ドルで販売することを決定しました。その後、人間の介入なしに独立して1時間14分も働き、何百ものコードファイルとプロンプトを作成しました。そして、私にたった一つのファイルを与え、それを実行すると、約束された500プロンプトセットを販売する動作するウェブサイト(非常に怪しい偽のマーケティング主張で埋め尽くされている)を作成し、デプロイしました。実際に立ち上げたサイトを見ることができますが、販売リンクは削除しました。そのリンクは実際に機能し、お金を集めていたでしょう。良心を無視して実際にこれらのプロンプトパックを販売すれば、約束された1000ドルを稼げると強く確信しています。

Claude Codeには親しみやすいインターフェースはありませんが、私が一度リクエストを送り、AIがそれについて質問し、1時間以上独立して働き、そして私が求めたものをエラーなく正確に返した様子を見ることができます。

これがClaude Codeの実際の動きであり、過去約1ヶ月で突然の能力飛躍を示す新世代AIコーディングツールの一つです。これらの新ツールが突然強力になった理由は、一つのブレークスルーではなく、二つの進歩の組み合わせです。第一に、最新のAIは、特にプログラミングタスクにおいて、はるかに多くの自律的な作業を実行し、多くのエラーを自己修正できるようになりました。第二に、AIには「エージェンティックハーネス」と呼ばれるツールとアプローチのセットが与えられ、新しい方法で問題を解決できるようになりました。これら二つの要因の結果、大手AI企業の最新ツールは大きな飛躍を遂げました。

METRは、AIが自律的に完了できるタスクの長さ(人間のプロフェッショナルにかかる時間で測定)を50%の信頼性で追跡しています。これは指数関数的に増加しており、過去数ヶ月で大きな飛躍が見られました。これはAI能力の一つの指標に過ぎませんが、他のほとんどの指標とも相関しています。

残念ながら、AIを試してみたい大多数の人にとって、これらの新ツールはプログラマ向けに作られています。つまり、本当にプログラマ向けなのです。Pythonコマンドやプログラミングのベストプラクティスを理解していることを前提とし、1980年代のコンピューターラボのようなインターフェースで包まれています。また、既存のプログラマのワークフローに適合するアプローチを使用して、コードの分析、トラブルシューティング、記述を支援するように明示的に設計されています。多くの点で、これは残念なことです。なぜなら、これらのシステムは実際にはあらゆるタイプの知識労働者に広く役立つものであり、その能力を見ることで(そして自分で実験することで)、AIの未来について多くを学べると考えるからです。この記事では、特にClaude Code(Opus 4.5搭載)に焦点を当てますが、主な競合であるOpenAIのCodex(GPT-5.2搭載)やGoogleのAntigravity(Gemini 3搭載)も同様に動作します。

Claude Codeがスタートアップ企業を立ち上げた例に戻ると、実際に印象的だったのは、ツールの能力のごく一部に触れたにすぎません。その場合、私はClaude Codeをコーディングにのみ使用しましたが、ライブサイトのユーザーテストを異なるペルソナで行いレポートを要求すると、多くのツールの一つであるウェブブラウザへの接続をデプロイします。Claudeはブラウザを制御し、人間のようにサイトをスクロールします。最初のパスではかなり楽観的なレポートをくれましたが、AIがお世辞を言いがちであることを知っているので、より批判的なレポートも要求しました。二回目のレポートは潜在的な問題をよりよく特定し(サイトにあった怪しい偽のレビューも見つけました)。次のステップとして、その提案を実装するよう簡単に依頼でき、最小限の入力でプロセスを続けられます。

マジックトリック

Claude Codeが非常に優れている大きな理由は、そのエージェンティックハーネスにおいて多種多様なトリックを使用し、非常に賢いAIであるOpus 4.5がLLMの問題を克服できるようにしているからです。例えば、AIがユーザーリサーチを行っている間に興味深いことが起こりました。コンテキストウィンドウがいっぱいになったのです。ご存知のように、AIは一度に限られた情報しか「記憶」できません。このコンテキストウィンドウは人間の基準ではかなり長い(15万語以上)ですが、会話全体、AIが読むすべての文書、撮影するすべての画像、AIをガイドする初期システムプロンプトが含まれるため、驚くほど早くいっぱいになります。AIには真の長期記憶がないため、コンテキストウィンドウがいっぱいになると、それ以上何も記憶できなくなります。カジュアルなチャットだけならこれは問題になりません。ChatGPTとの長い会話では、ローリングコンテキストウィンドウが使用され、AIは会話の最も古い部分を絶えず忘れますが、通常は最近の議論に基づいて即興で対応できます。しかし、実際の作業をしている場合、AIが新しいコードを読むたびに古いコードを忘れるのは大きな問題になります。

作業中の圧縮。Claude Codeはこの問題を別の方法で処理します。コンテキストが不足すると、停止してこれまでの会話を「圧縮」し、停止した正確な場所をメモします。その後、コンテキストウィンドウをクリアし、新しいバージョンのClaude Codeがメモを読み、これまでの進捗を確認します。これは、映画『メメント』の記憶喪失の主人公が、目覚めるたびに記憶がない状態で、タトゥーを参考にするのを思い起こさせます。これらのメモは、Claudeが前進し続けるために必要なすべてを与えます。これがClaudeが一度に何時間も実行できる理由であり、途中で行っていることを注意深く記録し、参照できる中間成果物(ソフトウェアの断片やレポートなど)を生成します。

これはClaude CodeがAIの限界を回避するために使用する唯一のトリックではありません。もう一つはスキルの使用です。この記事を読んでいる皆さんは、AIに何かさせるためにプロンプトを与えなければならないことをご存知でしょう。これらのプロンプトは指示として機能し、AIが賢くなるにつれて、複雑なプロンプト(100ページにも及ぶもの)を実行するのが非常に上手くなっています。しかし、これらの長いプロンプトはコンテキストウィンドウの多くを占有し、適切なタイミングで正しいプロンプトをAIに与える必要があります。つまり、人間が絶えずプロンプトを与えるか、AIにプロンプトを供給し続ける複雑な自動化システムを設計する必要があります。

スキルはこの問題を解決します。これらはAIがいつ使用するかを決定する指示であり、プロンプトだけでなく、タスクを達成するために必要なツールのセットも含まれます。素晴らしいウェブサイトを構築する方法を知る必要がありますか?「ウェブサイト作成スキル」をロードし、ウェブサイトの構築方法とその際に使用するツールを説明します。Excelスプレッドシートを構築する必要がありますか?独自の指示とツールを持つ「Excelスキル」をロードします。別の映画の例えを使うと、『マトリックス』のネオが武道の指示を頭にアップロードされ、新しいスキルを習得する「カンフーをマスターした」のようです。スキルは、必要に応じて知識を交換することで、AIがプロセス全体をカバーできるようにします。例えば、Jesse Vincentは、Claude Codeがソフトウェア開発プロセス全体を処理できるようにする興味深い無料スキルリストを公開しました。ブレインストーミングと計画から始まり、コードのテストに至るまで、必要に応じてスキルを習得します。スキル作成は技術的に非常に簡単で、平易な言語で行われ、AIが実際に作成を手伝ってくれます(これについては後で詳しく説明します)。

スキルのテキストの例。これはAnthropicが公開した「デザインスキル」。平易な言語で書かれ、AIに決定を委ねていることに注目。

スキルに加えて、Claude Codeには限られたコンテキストウィンドウを管理し、難しい問題を解決するための他の手段もあります。サブエージェントを作成することもできます。つまり、特定の問題を解決するために他の専門AIを効果的に起動します。これは多くの方法で役立ちます。Opusは大きく高価なモデルであるため、より簡単なタスクをより安価で高速なモデルに任せることができます。また、Claudeが複数のプロセスを同時に実行できるようになり、個人ではなくチームのように機能します。これらのモデルは独自のコンテキストウィンドウを持ち、非常に専門化できます。例えば、私はリサーチ用と画像作成用の別々のサブエージェントを構築しました。メインのAIモデルは、必要なときにこれらのエージェントを「雇って」専門的な作業を行わせます。

そして、自分でツールを作成する必要さえありません。誰でもスキルやサブエージェントを共有でき、AIエージェントを自社製品と連携させたい企業は、モデルコンテキストプロトコル(MCP)と呼ばれるアプローチを使用して、任意のAIに指示とアクセス権を与えることができます。出版業者からのMCPはAIが研究用の科学論文にアクセスできるようにし、決済会社からのMCPはAIに財務データを分析する能力を与え、ソフトウェアプロバイダーからのMCPはAIが特定のソフトウェア製品を使用できるようにします。結果として、非常に柔軟なシステムが構築され、Claude Opus 4.5のような賢い汎用AIが、必要に応じて専門スキルを適用し、ツールを使用し、自分の作業を追跡できるようになります。

Claude Codeは、コンピュータ上でファイルを操作できるため、特に強力です。つまり、あなたのマシンにアクセスできる人間ができるほとんどすべてのことをAIが行えるようになります。すべてのファイルを読み取り、新しいファイルを作成できます(PowerPointやWordも結局はコードであり、Claudeはコードの書き方を知っています)。ブラウザを使用してウェブにアクセスし、プログラムを記述して実行するなど、さまざまなことが可能です。もちろん、AIは完璧ではなく、AIにブラウザやコンピュータへのアクセス権を与えると、あらゆる種類の新しいリスクと危険が生じます。AIは削除すべきでないファイルを削除したり、意図しない結果をもたらすコードを実行したり、ブラウザ内の機密データにアクセスしたりする可能性があります。これらの警告にもかかわらず、Claude Codeの非常に簡単な入門編を紹介します。ただし、バックアップを作成し、専用のフォルダを使用し、失っても構わないものだけにアクセス権を与えるようにしてください。

アマチュアのためのClaude Codeガイド

これまではスクリーンショットにあるようにClaude Codeのコマンドラインインターフェースを使用してきましたが、(昨日から!)より簡単な方法でClaude Codeにアクセスできるようになりました。Claude Desktopを使用すれば可能です(ここからダウンロードしてインストールできます。ある程度の期間使用するには、少なくとも月額20ドルのサブスクリプションが必要です)。現在、デスクトップ版はコマンドラインインターフェースより機能が少ないですが、アマチュアにとってははるかに使いやすいです。

あとはAIにフォルダへのアクセス権を与えるだけです(Claudeはそのフォルダ内のファイルに対して何でもできるので、機密情報がある場合は注意し、バックアップを作成してください)。そして、AIとの作業を開始できます。調査やレポートの作成、クレジットカードの記録へのアクセスを許可してスプレッドシートに整理し異常を報告させる、データの可視化を依頼するなど、好きなことができます。先に述べた最も強力なオプションは、「/」で始まるスラッシュコマンドでアクセスします。/agentsと入力するとサブエージェントを設定でき、/skillsと入力するとスキルを作成またはダウンロードできます(デスクトップ版ではスラッシュコマンドが限られていますが、フルセットが近日中に追加されます)。多くの人がClaude Codeをさまざまな方法で使用しているので、自分に合った方法を試すことができますが、プログラマーでなくても実際にコーディングに使用することをお勧めします。

例えば、この記事を書いている間、私は時々Claude Codeのウィンドウを開き、AIにゲームを構築させていました。文明が興亡し、独自の言語、文化、経済を発展させる歴史シミュレーションです。数分ごとに、私はAIに一見不可能に見えるリクエストを送りました。「世界に独自のプレートテクトニクスと天候を持たせて」「支配者の家系図を追跡して」「イベントを劇的に要約するAIを組み込んで」などです。変更のたびに、AIはプレイテストを行い、新しいバージョンのゲームを生成しました。以前の「バイブコーディング」体験とは異なり、AIは行き詰まったり、同じ場所をぐるぐる回ったりすることなく、すべてスムーズに進みました。以下のビデオをご覧ください。有能なプログラマーなら気づくであろう問題がたくさんあると思いますが、結果はここからダウンロードできます(その部分もAIが処理しました)。

これは何を意味するのでしょうか?プログラマーであれば、すでにこれらのツールを探求しているべきです。プログラミングに隣接する仕事をしている人(データを扱う学者、コードを試してみたいデザイナー、自分が想像しているものを作ってみたい人)にとっては、実験する絶好の機会です。しかし、もっと深いポイントがあります。適切なハーネスを使えば、今日のAIは実際に重要で持続的な作業が可能であり、それが今度はタスクへの取り組み方を変え始めています。

当然のことながら、それはプログラミングから始まっています。AI界で最も有名なプログラマーの一人、Andrej Karpathyは最近次のように投稿しました。「プログラマーとしてこれほど遅れを感じたことはありません。この職業は劇的にリファクタリングされており、プログラマーが貢献するビットはますます疎らになり、間隔が空いています。過去1年ほどで利用可能になったものを適切に組み合わせれば、10倍強力になれるのに、そのブーストを得られないのは明らかにスキル不足のように感じます。」現在のClaude Codeの扱いにくさやコーディングへの特化に惑わされないでください。AIを他の知識タスクで機能させる新しいハーネスが近い将来登場し、それに伴う変化もやってくるでしょう。