新しいデータベースカテゴリ – 予測データベース
Aito.ai が提案する新しいデータベースカテゴリ「予測データベース」。学習ステップなしで予測クエリを実行でき、構造化データ上の機械学習を大幅に身近なものにします。
Aito.ai は、2019年に初めて提唱され、2026年に更新された予測データベースのコンセプトを再公開しました。この新しいデータベースカテゴリは、構造化データに対する機械学習の利用を根本的に変革します。ユーザーは、従来のデータベース操作と同じクエリインターフェースで、以下のように予測やレコメンデーションを実行できます。
{
"from": "engagements",
"where": {
"customer": "[email protected]"
},
"recommend": "product",
"goal": "purchase"
}このクエリは、顧客の購入確率に基づいて製品を推奨します。記事では、食料品店の例を用いて、予測データベースがどのように買い物リストの自動入力やパーソナライズ検索を実現するかを説明しています。特に、顧客の購買履歴に基づいて乳糖不耐症の顧客には乳糖フリー製品を優先表示する例が挙げられています。
技術的には、予測データベースはカラムナ推論をデータベースに深く統合することで、クエリ時にミリ秒単位でモデルを構築・利用できるようにしています。従来の教師あり機械学習のような個別の学習ステップは不要であり、処理負荷はデータベース内部に移行されます。これにより、アーキテクチャが大幅に簡素化され、反復開発が高速化されます。
コールドスタート時も、データベースはベイズ事前分布(列分布や列間相関など)を活用して即座に推論を行います。マルチテナント請求書ルーティングのベンチマークでは、Aito の精度が49.5%に達し、LightGBM の33.4%、ランダムフォレストの28.9%を上回りました。最も難しいターゲット(企業あたり約63候補)では、コールドスタート時に11%の精度を達成し、LightGBM の2.5%を大きく凌駕しています。
各予測には信頼度スコアが付随し、ベイズ推論に基づいて実際のデータから導出されます。統計的証拠が強ければ信頼度は高く、データが曖昧な場合は低くなります。このキャリブレーションにより、予測を安全に自動化できます。
記事は、予測データベースが予測の経済性を変えると結論づけています。予測が「プロジェクト」から「クエリ」になることで、内部ツール、プロトタイプ、最小限の製品にも簡単に予測機能を追加できるようになります。現在、4社が Aito を本番環境で利用しており、請求書自動化、価格推定、取引分類などに活用されています。
Aito は、このカテゴリを実現した最初の製品であり、MIT の BayesDB/BayesLite の理論的基盤を実用化したものです。固定料金プランと無料サンドボックスを提供しています。詳細は demo.aito.ai で体験できます。