Q&A: 現在のエージェンティックAIとは何か、そして私たちはそれをどのようにしたいのか?
コンピューター科学者のフィリップ・イソラ氏が、AIエージェントの仕組みと、急速に進歩するこの技術の将来について、誇大広告を排して解説する。
AIエージェントと呼ばれる自動化ソフトウェアシステムの導入が近年急増しています。2025年11月にMITスローン経営大学院とボストン・コンサルティング・グループが発表した報告書によると、調査対象企業の35%がすでにAIエージェントを導入しており、さらに44%が近いうちにエージェンティックAIの導入を計画しています。
これらのますます普及するツールの基本と潜在的な影響を理解するため、MITニュースは電気工学・コンピュータ科学科の准教授でコンピュータ科学・人工知能研究所のメンバーであるフィリップ・イソラ氏にインタビューしました。イソラ氏はAIエージェントが持つ知能や、エージェンティックAIシステムを動かす基礎モデルとメカニズムを研究しています。
エージェンティックAIとは何か、ChatGPTやClaudeなどの生成AIとどう違うのか?
イソラ氏は、エージェンティックAIは世界で行動を起こすAIであり、物理的な行動(ロボット操作など)やデジタルな行動(フライト予約など)を指すと説明します。一方、生成AIは物語や詩、アート、画像を作り出すものであり、ユーザーに代わって行動を起こすことはありません。「エージェント」という言葉は単なるブランド名で、通常はアプリケーションやウェブサイト、物理世界とのやり取りを支援するAIを指します。現在私たちが遭遇するエージェントのほとんどは、製品クレームについて話し合えるカスタマーサービスエージェントのようなデジタルエージェントです。
エージェントを提供するほとんどの企業は、同じいくつかのAIモデルを内部で使用し、行動を起こして記憶する能力を付与しています。エージェントはClaudeのような基本的な生成AIシステムを中核とし、企業はその基盤モデルの周りに製品やアプリケーション用のさまざまなラッパーを配置します。これらのラッパーは、エージェントが使用できる特定のツールである可能性があり、アプリケーションに依存します。例えば、エージェントは計算問題を解くために電卓にアクセスできたり、企業の財務データや過去のビジネス交渉を記憶するために複雑なハードドライブやオペレーティングシステムにアクセスできる場合があります。
エージェンティックAI開発の最大の課題は、トレーニングデータの不足です。オンラインでフライトを予約するシステムを作るのは簡単そうに見えますが、マウスの動かし方、クリックするボタン、問題発生時の対処法、航空券の値段交渉の仕方などを詳細に示すデータはほとんどありません。このようなシステムを訓練する方法の一つは、AIエージェントに航空会社のウェブサイトを訪問させ、試行錯誤しながら何が機能するかを見させることです。これらの環境はモデル化が難しいため、エージェントは多くの場合、試行錯誤によって学習する必要があります。
エージェンティックAIの有望な応用分野は?
イソラ氏は、最も成功している分野はコーディングエージェントだと考えています。これは生成AIから発展したものです。言語モデルをコードで訓練し、人間がコーディング問題を解決するために何をするかを予測できるようにしました。さらに、エージェントはフィードバックループを通じてさまざまな解決策を試し、正しい答えが得られたかどうかを確認することで学習できます。答えを確認できる限り、AIエージェントは良い戦略を見つけるまでこの試行錯誤のループを実行できます。
しかし、意思決定の自動化と人間の支援・情報提供の間には常にバランスが必要です。意思決定の結果を予測するシステムなどの分析的なAI手法は本質的にエージェンティックではありませんが、人間の意思決定者にとって非常に有益です。医療、セキュリティ、高度なビジネスポリシーなど、リスクが高いか安全性が重要なケースでは、技術が完全に自動化できる段階にないか、私たちがそのような自動化に抵抗を感じるかもしれません。
AIエージェントを使用する際に考慮すべきリスクは?
大きなリスクの一つは、特定の作業をエージェントに任せることが非常に簡単であるという事実から生じます。コーディングエージェントを使えば、「バイブコーディング」のようにエージェントにコードを作成してもらうだけで、自分で苦労する必要がありません。あまりにも簡単なため、人々が正しく動作しているかどうかの検証に十分な労力を割かなくなる大きなリスクがあります。バグが混入したり、プライベートデータが漏洩したりする可能性があり、これはすでに発生しています。
エージェントは不完全です。訓練が不十分で何をすべきかわからないために間違いを犯す可能性があります。しかし、たとえ非常に有能であっても、人間が適切に使用しなかったり、あまりにも曖昧な指示を与えたりすると、人間のミスが原因でAIエージェントが間違いを犯す可能性があります。人間がすべての結果を考えることに関与しなくなれば、そうしたミスを犯しやすくなるでしょう。
さらに、スキル低下のリスクもあります。これがどこまで進むかは不明ですが、エージェントに宿題やコーディング、数学を依存するようになると、自分でそれを行う能力を失う可能性があります。そして、技術がまだ完全に自動化できる段階にないにもかかわらず、その能力を早すぎる段階で失う可能性があります。
エージェンティックAIの未来は?
現在エージェンティックAIと考えられているものは、ツールを使ってデジタルおよび物理システムと対話する大規模言語モデルを指します。明らかな限界の一つは、内部が言語モデルのアーキテクチャであり、テキストデータで訓練されていることです。さらに強力なAIエージェントを作るには、動画、物理的な力、時系列データ、レーダースキャンなどの他のモダリティをモデル化する必要があるかもしれません。連続データ、高次元データ、確率的データなどを処理できる根本的に異なるアーキテクチャのモデルが必要になるでしょう。
しかし、一方で、非常に優れたコーディングモデルが、センサーやアクチュエーター、ウェブAPIとインターフェースするための操り人形として機能する可能性はないでしょうか?数学、言語、コードを理解する超スマートな推論システムがあれば、カメラとキーボードを与えることで空間領域で何をすべきか理解できるかもしれません。次のAIの波は、センサー、アクチュエーター、ツールを備えたClaudeになるのか、それともゼロから新しい方法で構築されたものになるのか?それが今、多くのAI関係者が取り組んでいる大きな問題です。