AI News HubLIVE
站内改写2 分で読了

トークンが高いのは、モデルにゴミをたくさん与えているから|@アマゾン王暁野 AIGC2026

2026年中国AIGC産業サミットで、アマゾンウェブサービスの製品技術部門テクニカルディレクターである王暁野氏は、企業の87%がAIを大規模に展開していると宣言しているが、実際に価値を得ているのはわずか10%であると指摘した。彼は個人と企業レベルのエージェント導入の大きな違いを強調し、企業はコンピューティング、モデル、データ・知識、エージェンティックプラットフォーム、アプリケーションの5層に注目すべきだと述べた。また、トークンコストが高いのは、モデルに無関係な情報を多く与えすぎていることが原因であると指摘した。

ソース量子位著者: 梦晨

2026年5月に量子位(QbitAI)が主催した2026年中国AIGC産業サミットで、アマゾンウェブサービス(AWS)製品技術部門テクニカルディレクターの王暁野氏が、デモから本番環境へのエージェント導入のギャップを埋める方法について基調講演を行った。彼は衝撃的なデータを提示した。企業の87%がAIを大規模に展開していると報告しているが、実際にビジネス価値を得ているのはわずか10%である。王氏によると、Mac Miniで楽しいエージェントを動かすことと、何千ものエージェントを分散エンタープライズ環境で安全に、確実に、継続的に運用することは、まったく次元の違う工学的複雑さを持つという。

王氏は、企業がエージェントを採用する際に直面する4つの大きなギャップを特定した。それは、モデル選択と応答速度、構築の複雑さ、非技術者にとっての使いやすさ、そしてエンドツーエンドのエージェント統合を推進する人材不足である。彼は、AIは単なる大規模言語モデルだけでなく、その周りの運用、制御、本番対応機能である「ハーネス」が同様に重要であると強調した。モデルをCPUに例えれば、誰もベアマザーボードをユーザーに渡さない。OS、ソフトウェア、ユーザビリティを備えた完全なシステムが必要なのだ。

AWSのソリューションの中核は、エンタープライズエージェント展開のための5層アーキテクチャである。第1層はAIコンピューティングで、AWSのカスタムチップ(GravitonやTrainium)がコストあたりの最適なパフォーマンスを提供する。第2層はモデルで、Amazon Bedrockは幅広いモデル選択肢を提供しつつ、エンタープライズデータを保護する。第3層はデータと知識である。従来のデータプラットフォームは人間向けだが、AIエージェントにはメモリの共有/分離、ライフサイクル管理、トークン効率などの機能を備えたAI対応データプラットフォームが必要である。王氏は、トークンコストが高いのは、多くの場合、モデルに無関係な情報を大量に与えているからであり、トークン単価が高いからではないと指摘した。第4層はエージェンティックプラットフォームで、AWS Bedrock AgentCoreはランタイム、メモリ、コードインタプリタ、アイデンティティ、ゲートウェイ、ポリシー、評価、可観測性のモジュールを提供する。第5層はエージェントアプリケーションであり、Amazon Qのようなパーソナライズされたワーキングエージェントは、メール、チャット、CRMツールを統合してプロアクティブなアシスタントとして機能する。

王氏はまた、OpenAIとの協業を発表し、Bedrock上でマネージドエージェントと最先端モデルを提供すると述べた。これにより、企業は柔軟なオープンフレームワークとすぐに使えるマネージドソリューションの選択肢を得られる。彼は、すべてのアプリケーションが再発明されると結論付け、AWSはより良いモデル、信頼できるデータ、本番対応プラットフォームを提供することでこのプロセスを加速すると述べた。講演は実際の顧客事例(例えば、AgentCoreを使用してインフラ計画を削減しビジネス価値に集中した紫訊(Zixun))に基づいている。