清華大学系チームが大規模モデル向け「スマート計算パワーグリッド」を構築
清華大学出身のスタートアップ、Shishi Technologyは独自の並列最適化技術により、異種計算リソースと推論最適化エンジンを統合し、トークンあたりのコストを40%削減。国産トークン最適化工場を目指し、AI導入の障壁を低くする。
記事インテリジェンス
要点
- 2021年設立、国家スーパーコンピューティングセンター(無錫)のコアチーム出身、創業者Yan Bowenは清華大学博士研究員。
- NVIDIA GPUや国産AIチップを統合した異種計算プールで、遊休リソースを有効活用。
- 推論最適化によりスループット30~50%向上、トークンあたりコスト40%削減。
- マルチプロバイダー障害復旧システムで99.9%の可用性を確保し、安定したトークン生産を実現。
重要な理由
このニュースが重要なのは、2021年設立、国家スーパーコンピューティングセンター(無錫)のコアチーム出身、創業者Yan Bowenは清華大学博士研究員ためです。
技術的影響
モデル選定、推論コスト、プロダクト能力、評価基準に影響する可能性があります。
清華大学系のチームが、大規模モデル向けに「スマート計算パワーグリッド」に例えられる新しいソリューションを開発した。Shishi Technology(是石科技)は、2021年に国家スーパーコンピューティングセンター(無錫)の研究チームを母体として設立され、高騰するGPUの不足と国産チップの活用困難という課題に取り組んでいる。同社の目標は、異種計算リソースを統合し、安定して低コストなトークン生産を実現することだ。
同社は、NVIDIA GPUだけでなく、昇華、Kunlun Core、その他の国産AIチップを含む広範なリソースをサポートする統合計算プールを構築。スマートスケジューリングにより、需要に応じて動的に計算能力を割り当てる。これは、複数の発電所から電力を供給する電力網に似ている。
中核技術は「Token最適化工場」であり、推論最適化とハードウェア統合を組み合わせている。CUDAカーネル最適化、PagedAttention、連続バッチ処理、混合精度推論、FlashAttention、投機的デコード、KVキャッシュ管理などの技術により、ベースラインと比較してスループットを30~50%向上させ、トークンあたりのコストを40%削減した。
信頼性も重要な柱だ。マルチプロバイダーによるフェイルオーバーシステムを構築し、99.9%の可用性を保証。航空機の冗長エンジンのように、ミリ秒単位でプライマリリソースからバックアップに自動切り替えを行い、サービス中断を防ぐ。同社は、中国最大かつ最先端の国産トークン最適化工場となることを目指し、国産チップの効率的活用とAI導入の民主化を推進している。
長期的には、Shishi Technologyは、トークン生産を電力網のように信頼性が高く費用対効果の高いものにすることで、AIへのアクセスを民主化することを目指している。標準化、国産化、効率性に焦点を当てることで、中国のAIエコシステムの基盤インフラを構築している。この動きは、外国製GPUへの依存を減らし、自国のチップ製造能力の可能性を活用しようとする中国にとって重要である。同社の成功は、企業がAIを導入する際の障壁を大幅に低減し、スマート製造、自律システム、その他のAI駆動型アプリケーションへの産業変革を加速させる可能性がある。