AI News HubLIVE
サイト内リライト2 分で読了

Tensordyne、AI行列演算を対数変換で高速化、推論性能を大幅向上

Tensordyneは対数演算を活用したNapier推論チップを発表。行列乗算を加算に置き換えることで、性能を10倍以上向上させ、消費電力を削減。3nmプロセス、300W、空冷対応。2026年末にクラウドアクセスを計画。

ソースHacker News AI著者: peter_d_sherman

Tensordyne社は、AI推論向けの革新的なNapierチップを発表しました。このチップは、行列演算に対数演算を適用することで乗算を加算に置き換え、推論性能を大幅に向上させるとともに消費電力を削減します。Napierという名称は、対数を発明したスコットランドの数学者ジョン・ネイピアに由来します。従来のGPUと比較して、この対数アプローチは一桁以上の性能向上を実現し、コストとエネルギー消費も低減します。

Napierチップは48個の対数コアを搭載し、各コアは128×128のシストリックアレイを内蔵。NVFP4、FP8、FP16のデータ形式に対応します。さらに、ベクトル処理ユニットやRISC-Vコアも統合され、softmax演算やMoEルーティングなどを並列処理可能です。TSMCの3nmプロセスで製造され、1380億個のトランジスタを集積しながら、消費電力はわずか300ワット。これはNVIDIA Blackwell B300の4分の1であり、空冷によるデータセンター展開が可能です。

システム構成としては、9個のNapierチップと40コアのXeonプロセッサを1つのコンピュートトレイにまとめ、ラックあたり288個のチップを搭載。さらに320個のXeonコアと4608個のRISC-Vコアが異なるレベルの推論タスクを処理します。ラック間は64個の200Gb/sイーサネットリンクで接続され、高い帯域幅を実現しています。

TensordyneはRK Anand氏とGilles Backhus氏によって共同設立され、両氏は以前に自動運転AIに特化したRecogni社を設立しました。同社は3ラウンドで1.76億ドルを調達し、120人以上のチームを擁しています。Napierチップの製造はBroadcomが担当し、HBMメモリとウェハーの供給を確保しています。Tensordyneは2026年末にクラウドアクセスを開始し、2027年第1四半期にベータ版のTDN Podシステムを提供予定です。Napierチップが大量生産され、主要な推論フレームワークをサポートできれば、AIハードウェア市場に変革をもたらす可能性があります。