AI News HubLIVE
站内改写2 分で読了

トークンが高いのは、モデルにゴミを大量に与えているから|@アマゾン・ワン・シャオイェ AIGC2026

2026年中国AIGC産業サミットで、アマゾン ウェブ サービスのテクニカルディレクター、ワン・シャオイェ氏は、87%の企業がAIを大規模導入していると主張する一方、実際に生産価値を得ているのはわずか10%だと指摘しました。エンタープライズ向けエージェントの導入には、モデル選択、構築の複雑さ、利用のハードル、人材不足という4つのギャップを克服する必要があると強調し、AWSの5層アーキテクチャ(コンピュート、モデル、データ、ハーネスプラットフォーム、エージェントアプリケーション)やQuickなどの製品を紹介しました。

ソース量子位著者: 思邈

2026年5月31日、量子位(QuantumBit)が主催する2026年中国AIGC産業サミットにおいて、アマゾン ウェブ サービス(AWS)のプロダクト技術部門テクニカルディレクター、ワン・シャオイェ氏が「エージェント導入の溝を越える:モデルからエンタープライズAIエージェントの実装へ」と題した講演を行いました。同氏は、87%の企業がAIを大規模に導入したと主張する一方で、実際に生産価値を得ているのはわずか10%に過ぎないという衝撃的なデータを提示しました。デモの作成は容易でも、本番環境で確実に動作させることが真の課題であり、個人がMac miniでエージェントを動かして自由に再起動できるのと、数千のエージェントを分散エンタープライズ環境で安全・信頼性高く停止なく運用するのは全く次元の異なるエンジニアリングの複雑さだと述べました。

ワン氏は、エンタープライズ向けエージェントの実装には4つの大きな溝があると指摘しました:(1) モデルの選択と応答速度、(2) 構築の複雑さ(分散システムの長期安定稼働)、(3) ビジネスユーザーにとっての使いやすさ、(4) エンドツーエンドでエージェントを導入できる人材の不足。これらの課題に対し、AWSは5層のアーキテクチャを提案しています。

第1層:コンピュート(推論最適化) 汎用チップでは全てのシナリオで最適なコストパフォーマンスを提供できないため、AWSはGraviton(ArmベースCPU)やTrainium(専用AIチップ)など、特定のワークロードに最適化したカスタムチップを提供しています。

第2層:モデル 顧客は単一モデルに縛られるべきではなく、選択肢が必要です。Amazon Bedrockは、中国のモデル(智譜GLM、MiniMaxなど)を含む多様なモデルをサポートし、エンタープライズグレードのデータ保護とプライバシーを提供します。

第3層:データと知識 従来のデータプラットフォームは人間向けでしたが、現在はAIエージェント向けに再設計が必要です。具体的な課題として、メモリの共有と分離、メモリのライフサイクル管理、トークン使用効率が挙げられます。トークンコストが高い理由は単価だけでなく、モデルに無関係な情報を大量に与えていることに起因します。

第4層:ハーネスプラットフォーム モデルそのもの以上に、本番運用に必要な「ハーネス」が重要です。AWSのBedrock AgentCoreは、自動スケーリング、メモリ管理、アイデンティティ統合、ポリシー適用、可観測性など、エンタープライズ向けの機能を提供します。モデルをCPUに例えるなら、ハーネスはOSやアプリケーションに相当します。

第5層:エージェントアプリケーション コーディングエージェントやワーキングエージェント(例:Amazon Quick)など、すぐに使えるエージェントを提供。Quickは社内の各種システムを統合し、個人の知識グラフを蓄積しながら、まるでパーソナルアシスタントのように動作します。

ワン氏はまた、AWSとOpenAIのパートナーシップに触れ、OpenAIの最先端モデルとベストプラクティスをAWSのセキュリティ基盤と組み合わせたマネージドエージェントを提供していると述べました。最後に、「すべてのアプリケーションは再構築される」というAWS CEOマット・ガーマンの言葉を引用し、エージェント時代を受け入れるよう企業に呼びかけました。