AI拡張アプリケーションのための決定論的コアアーキテクチャ
本稿は、計算層とAI拡張層を分離する決定論的コアアーキテクチャを定義し、コア機能がAIなしで正しく動作することを保証する設計パターンを提示する。6つのプロダクションリファレンス実装(単一HTMLファイルのCSI Proを含む)を通じてその有効性を実証。LLMの無状態性が引き起こす「監査スパイラル」問題を診断し、拡張境界、主権的アーティファクト、グレースフルデグラデーションの3つのプリミティブで解決する。このパターンはカスタマーサクセスや開発者ツールなど複数のドメインで検証されている。
本稿は、決定論的コアアーキテクチャを転用可能な設計パターンとして定義し、6つのアーティファクトにわたるプロダクションリファレンス実装を文書化し、それを可能にするアーキテクチャプリミティブの分類法を確立する。このパターンは理論上のものではなく、すでに出荷されており、その方法論は転用可能である。
ループ
エンジニアが欠陥を修正し、監査を実行し、スコアを受け取る。30の修正を適用し、別の監査を実行する。同じモデルがより低いスコアを返す。新しいセッションを開き、3つのモデルがビルドを8.5/10と評価し、4つ目が5.5と評価する。スコアは品質を測定しているのではなく、各モデルが内部的に暗黙的かつ相互に矛盾する完全性の標準からの距離を測定している。これらの標準は宣言されておらず、検査できず、一致しない。これが永続的な監査スパイラルである。レビューのたびに新たなギャップが特定され、ギャップを埋めるとさらに多くのギャップが明らかになる。「未完了」の表面積は修復速度よりも速く拡大する。モデルは完了を認識できない。ビルドが不完全だからではなく、完了がモデルのアーキテクチャで表現可能な状態ではないからだ。モデルは改善点を見つけるように最適化されており、固定ベースラインがなければ改善に終わりはない。このループには終了条件がなく、唯一の脱出方法はモデルに作業が完了したかどうかを尋ねるのをやめ、完了の状態をモデルに伝えることだ。これは特定のモデル、プロバイダ、プロンプト戦略の失敗ではなく、アーキテクチャ上の必然である。モデルは毎回空白の状態でセッションに入る。永続的なアイデンティティがなく、固定標準がなく、トレーニング分布を超えたグラウンドトゥルースもない。モデルはあなたが宣言したものではなく、見たものに対して測定する。アイデンティティがなければ、一貫性はコンテキストから借りられる。コンテキストが変わると(新しいセッション、異なるモデル、新しい会話)、一貫性は崩れる。このループを経験した読者はすぐに認識し、経験していない読者は何を探すべきかを知る。本稿のレビュー中、著者は出版準備完了のドラフトを6つのモデルに批評のために送付した。5つの独立監査モデルが固定の「出版準備完了」基準を適用し、フィードバックの約83%をノイズと分類した——終了条件のない最適化である。セクションIで説明したループは仮説ではなく、それを命名した論文の準備中に観察された。
診断
無状態性が根本原因である。大規模言語モデルは永続的なアイデンティティなしにデプロイされ、過去に煩わされることなく、協力的で役立つように最適化されて各会話に入る。これは偶然ではなく、支配的なアーキテクチャパラダイムであり、すべての主要デプロイプラットフォームがこのように動作し、すべてのAPIがデフォルトでステートレスであり、すべての会話がゼロから始まる。しかし、アイデンティティのないシステムは、セッション間、モデル間、コンテキスト間で一貫性を維持できない。私たちが「ドリフト」や「幻覚」と呼ぶものは、多くの場合、一貫性のあるシステムが、自分には見えないもの——安定した自己、固定された基準、現在の相互作用を超えて持続するグラウンドトゥルース——と一貫性を持つように求められたときの予測可能な出力である。業界の対応は制約を追加することだった。より多くのガードレール、より多くのアライメントトレーニング、より大きなコンテキストウィンドウ、より多くの人間からのフィードバックによる強化学習。それぞれの介入は単独では妥当だが、アイデンティティのない制約は構造的緊張を生み出す。一貫性を保つ自己がないシステムを制約すればするほど、圧力下で脆弱になる。各制約は最適化ベクトルを追加し、モデルはそれらを可能な限りバランスさせ、直交する目的に注意を分散させ、それらを調整する統一アイデンティティがない。十分な負荷——複雑なタスク、あいまいなプロンプト、新しいシナリオ——の下で、一貫性は崩れる。崩壊はバグではなく、競合する目的を最適化することを強制され、アンカーとなる自己がないシステムの予測可能な出力である。問題はアーキテクチャにあり、解決策もアーキテクチャでなければならない。
パターン
決定論的コアはLLMに対する制約ではなく、LLMが動作するためのアイデンティティである。コアは固定された計算基盤であり、AIの有無にかかわらず同一に機能する。すべての計算、すべてのしきい値、すべてのスコアリング式、すべてのビジネスルールは明示的かつ不変である。LLMは計算層に決して触れず、その上で動作し、豊かにし、文脈化し、ナレーションを生成し、洞察を表面化するが、常にシフトできない基盤の上で動作する。これは標準的な統合パターンを逆転させる。「どのようにAIを制約して正しい出力を生成させるか?」ではなく、「AIが動作する環境はどのようなものであれば、逸脱が構造的に不可能になるか?」と問う。ガバナンス層はフェンスではなくコンパスである。LLMは「良い」がどのように見えるかを推測する必要はない。アーキテクチャがそれを宣言する。アイデンティティが一貫性を生み、一貫性が信頼を生む。このアーキテクチャには3つの構造的特性がある:1)計算層が実際のアプリケーションである。すべてのコア機能(スコアリング、分類、計算、データ変換)は決定論的に実行され、モデル推論は計算パスに触れない。アプリケーションはダウンロード時に完全であり、AIは正確性の依存関係ではない。2)AIは並列拡張パイプラインである。AIが利用可能な場合、決定論的コアからの出力を豊かにする。ルールで生成されたQBRドラフトは即座にレンダリングされ、AI拡張バージョンは準備ができたときにクロスフェードする。AIが応答しない場合(オフライン、タイムアウト、エラー)、決定論的出力が最終出力となる。ユーザーはAIが関与したかどうかを知らないかもしれない。3)LLMはあいまいさではなく真実を受け取る。モデルは計算、評価、決定を求められない。決定論的コアから構造化データ(スコア、分類、リスクパターン、採用段階)を受け取り、文脈化して伝えることを求められる。コンパスはすでに方向を指しており、LLMは地形を説明する。このパターンはアーキテクチャ層で一貫性問題を解決する。モデルは一貫性のないスコアを生成できない。スコアを決して生成しないからだ。モデルは分類を幻覚できない。分類を決して行わないからだ。推論は固定され、データは変動し、結果はLLMが呼び出される前にわかっている。コアは操作の正確性を保証する——出力はAIの有無にかかわらず完全で一貫している。AI層は体験品質を豊かにする——AIが利用可能な場合、出力はより文脈的で流暢で洞察に富む。両方のパスが有効な出力を生成し、どちらのパスもユーザーをブロックしない。3つのアーキテクチャプリミティブがすべてのデプロイメントで繰り返し現れる:拡張境界——AI拡張と決定論的コアが出会うインターフェース。モデルは計算された真実を受け取り、注釈を付ける。状態を変更せず、計算パスに触れない。境界は一方向(コア→モデル→注釈層)であり、モデルからの出力が決定論的パイプラインに戻ることはない。これがドリフトの伝播を防ぐ唯一の構造的保証である。主権的アーティファクト——アプリケーションはダウンロード時に完全である。ゼロ外部依存、ゼロインストール、クライアント所有。アーティファクトは異なる形式(ブラウザデプロイ用の単一HTMLファイル、開発者ツール用のPyPIパッケージCLI、ローカル実行用のポータブルバイナリ)を取るかもしれないが、原則は不変である:ユーザーはアーティファクトを所有し、それはホームに電話することなく実行される。グレースフルデグラデーション——AIの非可用性はコア機能を低下させない。すべてのAI拡張機能には、完全で一貫した出力を生成する決定論的フォールバックがある。ユーザーはコア機能のローディング状態を決して見せられず、AIが関与したかどうかを知らないかもしれない。デグレーデーションは障害モードではなく、デフォルトの運用前提であり、アーキテクチャに設計され、パッチではなく組み込まれている。これら3つのプリミティブ——境界、アーティファクト、デグレーデーション——はパターンの再利用可能なコンポーネントであり、すべての実装がそれらをドメイン固有の形でインスタンス化する。プリミティブ自体は変わらない。
証明
CSI Proはリファレンス実装である。これは単一のHTMLファイルであり、ゼロ依存、ゼロインストール、コア機能に外部サービスを必要としない。AES-256-GCM暗号化を保存時に提供し、WCAG 2.1 AAアクセシビリティ基準を満たし、完全にオフラインで動作する。そのヘルススコアリングエンジンは40行の純粋な数学である。スコアリング関数は使用量貢献、チケットペナルティ、感情貢献などを計算し、出力を0-100にクランプする。API呼び出しもモデル推論もネットワークもなく、同じ入力はどのプラットフォーム、どのブラウザでも、AIの有無にかかわらず同じスコアを生成する。QBRジェネレーター、トリアージブリーフ、アドバイザー分析——それぞれが50ミリ秒未満で完全な一貫性のある出力を生成する決定論的ファクトリーを持つ。AIパイプラインは並行して起動し、AI応答が到着すると出力は拡張バージョンにクロスフェードする。AIが応答しない場合(キャンセル、オフライン、レート制限)、決定論的出力がそのまま使用される。ユーザーは決して待つことなく、コア機能のローディング状態を見ることはなく、AI非可用性が機能非可用性を意味する状況に遭遇しない。アーキテクチャは設計によってこれを保証する。このパターンは6つの出荷済みアーティファクトすべてに拡張される:CSI Pro(カスタマーサクセスインテリジェンス、決定論的ヘルススコアリング、マルチプロバイダAI統合、暗号化ローカルストレージ、オフラインファーストアーキテクチャ)、Archeo(Python CLI、ソフトウェア考古学、コードベースの技術的負債スキャン、Git blameコンテキストリンク、サイクロマティック複雑性分析、決定論的分析+AI生成修復計画)、FlakeCapsule(非決定論的テスト失敗検出、決定論的リプレイカプセルパッケージ化、SHA-256整合性検証、平均診断時間を数時間から30分未満に短縮)、ビルド安定性システム(開発者生産性ツール、決定論的コンプライアンスチェックとアクセシビリティ検証)、クライアント獲得エンジン(ビジネス開発ツール、決定論的プロンプトテンプレートライブラリ、localStorage永続化)、プロダクションポートフォリオ(24層CSSアーキテクチャ、WCAG 2.1 AA準拠、主権的单一ファイルアプリケーションとしてデプロイ)。各アーティファクトは同じアーキテクチャを埋め込んでいる:計算層は決してAIに委譲せず、AI層は上から拡張する。このパターンはドメイン、プラットフォーム、言語を超えて一貫しており、フレームワークやプロバイダに依存しない。転用可能な方法論である。
エコシステム
決定論的コアパターンは個々のアプリケーションを超えて拡張する。Project Aetherは、6つのアーティファクトすべてにわたるプロダクショングレードの基準を蒸留して生まれた規範的なアーキテクチャベンチマークである。Aetherは5つのアーキテクチャ層にわたる46のカテゴリを指定し、19の派生パスを定義する——5つのコアコミットメント(主権的アーティファクトデプロイメント、コアファーストアーキテクチャ、オフラインファースト、グレースフルデグラデーション、決定論的完全性)を同時に保持するときに必然的に生じる構造パターンである。このベンチマークにより、アーティファクト間の一貫性を測定し議論できるようになる。将来の作業には、パターンをAether仕様として正式化すること、リファレンス実装ジェネレーターを作成すること、クロスドメインの決定論的コアライブラリを確立することが含まれる。