AWSがエージェント向けデスクトップを公開
AWSは短い公開プレビューの後、Amazon WorkSpaces for Agentsを一般提供開始。エージェントがクラウド上の仮想デスクトップを利用してレガシーアプリケーションを操作できるようにし、カスタム統合不要。MCPとコンピュータビジョンをサポートし、人間による監視と介入が可能。
短い公開プレビューの後、AWSは本日、Amazon WorkSpaces for Agents(Amazon Connect Agent Workspaceと混同しないでください)を一般提供開始しました。Amazon WorkSpacesは、企業が従業員に仮想デスクトップを提供するためのAWSの永続的なクラウドベースデスクトップです。WorkSpaces for Agentsも仮想デスクトップですが、クラウド上のデスクトップアプリケーションを操作する必要があるエージェント向けに設計されています。
これにより、エージェントはカスタム統合を構築したりツールを近代化したりすることなく、企業のレガシーデスクトップアプリと対話できるようになります。AWSの今回のリリースにおける参照顧客は、オランダの多国籍企業Wolters Kluwerです。同社のワークプレーステクノロジーディレクターAndré Akkerman氏は本日の発表で次のように述べています。「当社のチームは世界中の顧客向けに複雑な税務、法務、コンプライアンスワークフローを管理しています。Amazon WorkSpacesにより、AIエージェントをそれらのワークフローに直接配置できるようになりました。エージェントは従業員と同じ業務アプリケーションにアクセスして操作でき、再構築の必要はありません。これは自動化の考え方における意味のある前進です。」
有効化されると、エージェントはModel Context Protocol(MCP)を使用してこれらのデスクトップに接続し、セッションをストリーミングしてデスクトップアプリと必要に応じて対話できます。アクセスはAWSのIdentity and Access Management(IAM)サービスで管理され、監査性はAWS CloudTrailとAmazon CloudWatchで処理されます。
AWSは、MCPとコンピュータビジョンエージェント(現時点ではまだ遅く、スクリーンショットを分析してアクションを実行するループを常に行う必要がある)は補完的なアプローチであると主張しています。現在のAWSの方法は、サービス用のメインOSイメージを作成する際にユーザーがファイルシステムMCPサーバーをWorkSpaceにインストールするというものです。これにより、エージェントはツールコールを通じてファイルを読み書きでき、スクリーンショットループを経由する必要がありません。「適切な設計パターンは、各サブタスクを最も効率的なインターフェースにルーティングすることです。MCPツールが存在する場合はそれを呼び出し、APIがタスクをカバーしていない場合やGUIとの対話自体が目的である場合にのみ、ビジョン駆動アクションにフォールバックします」と同社は発表で説明しています。「さらに、ワークフローの大部分がMCPを経由する場合、残りのビジュアルサブタスクは焦点を絞った操作に縮小されます。ステップが少なく、シーケンスが短く、失敗も少なくなります。MCPツール転送により、このパターンがWorkSpaces Applicationインスタンス内で機能します。」
一般提供開始に伴い、AWSはエージェントを監視し、必要に応じて制御を引き継ぐ機能も追加しました。「エージェントが予期しないアクションを実行しているのを観察した場合、停止ボタンを使用してセッションを再起動したり状態をロールバックしたりせずに直接介入できます。開発から本番に移行するにつれて、タスクに必要な人間の監視頻度に基づいて各ワークフローに適したモードを選択できます。」コンピュータビジョンエージェントはまだ遅いため、人間が長時間これらを監視することはなく、給与の有効活用にもなりません。したがって、現時点で特定のタスクに多くの監視が必要な場合、そのワークフローには適していない可能性があります。
さらに、AWSは企業がActive Directoryを使用してエージェントにIDを付与できるようにしました。これにより、通常のユーザーに使用されるポリシー、アクセス制御、監査ログがエージェントにも適用されます。