AI News HubLIVE
站内改写3 分で読了

Model Due Diligence:AIモデルの静的サプライチェーン検証ツール

Model Due Diligence は、ローカルのAIモデルファイルやクローンしたモデルリポジトリをOllamaやllama.cppなどのランタイムにインポートする前に、静的なサプライチェーン検証を行うPython CLIツールです。ファイルインベントリ、ハッシュ、リスクの高いシリアライゼーションフォーマット、不審なテキストやコードパターン、Gitの出自などをチェックし、MarkdownレポートやJSON/SARIFレポートを生成します。ツールはウェイトをロードしたりコードを実行したりせず、リスクスコアは0~100です。

ソースHacker News AI著者: djhope99

Model Due Diligence は、AIモデルの静的サプライチェーンセキュリティに特化したPythonコマンドラインツールです。その主な目的は、ローカルのモデルファイルやクローンしたモデルリポジトリがOllama、llama.cpp、LM Studio、Transformersなどのランタイムにインポートされる前に、静的な証拠を提供し、「このモデルアーティファクトやリポジトリが信頼できない、ロードすべきでない、あるいは追加のレビューなしに実行すべきでないという明らかな静的な証拠はあるか?」という実用的な問いに答えることです。

このツールはさまざまな静的チェックを実行します。ファイルインベントリ、SHA-256ハッシュ、パーミッション、シンボリックリンクの検出、pickle、.pt、.pth、.bin、.joblib、H5などの高リスクシリアライゼーションフォーマット、.gguf、.safetensors、.onnxなどの低リスクモデルフォーマット、GGUFマジックバイトとバージョンメタデータ、safetensorsヘッダーメタデータ、不審なテキストとバイナリ文字列、Python AST内のeval、exec、compile、pickle.loads、os.system、subprocessなどの危険な呼び出し、trust_remote_code=Trueの使用、高リスクシリアライゼーションフォーマット内の疑わしいpickleバイトマーカー、高エントロピーの非モデルファイル、Gitの出自(origin remote、現在のコミット、ダーティワークツリー、Git LFSリスト)、そしてModelScan、Semgrep、Bandit、pip-audit、detect-secretsなどの外部スキャナー出力をチェックします。また、オプションでRuff、Pyright、mypyを使用したコード品質の自己チェックも行えます。

ツールは3種類のレポートを生成します:人間が読めるMarkdownレポート、自動化のための決定論的JSONレポート、そしてコードスキャンワークフローに統合するためのオプションのSARIFレポートです。

Model Due Diligence は意図的に静的であり、通常のスキャン中にモデルウェイトのロード、信頼できないリポジトリコードのインポート、モデル固有のスクリプトの実行、モデル推論の実行、アーティファクトの外部サービスへの送信、ローカルスキャンのためのネットワークアクセスを必要としません。静的スキャンでは、モデルウェイトに直接エンコードされた悪意ある動作、スリーパーエージェントやトリガーベースのバックドア、トレーニングデータのポイズニング、ベンチマーク操作、ファインチューニング後にのみ現れる悪意ある動作、下流のRAGやエージェントワークフローにおけるプロンプトインジェクションへの従順性、および実行時のデータ窃取動作を確実に検出することはできません。そのため、このツールは信頼のオラクルとしてではなく、リスク低減ゲートとして使用すべきです。

プロジェクトはモジュラーモノリスアーキテクチャを採用しており、CLI、オーケストレーション、スキャナー、リスクスコアリング、レポート間の明確な内部境界を維持しています。リスクスコアリングは、発見事項を重要度に正規化し、0~100の範囲のスコアに変換します。重要度はINFO(0点)、LOW(3点)、MEDIUM(10点)、HIGH(30点)、CRITICAL(60点)です。リスクレベルはLOW(0-29、サンドボックスでの初回実行は許容)、MEDIUM(30-69、発見事項を理解するまでインポートしない)、HIGH(70-89、重大なリスク指標あり、すべての発見事項が正当化されない限りロードしない)、CRITICAL(90-100、深刻または複数の高リスク指標あり、デフォルトで安全でないとみなす)です。スコアは意図的に保守的であり、自動的な信頼判定ではなく意思決定の補助です。

インストールにはPython 3.11以上とGitが必要です。仮想環境でのインストールが推奨され、オプションの外部スキャナー統合もサポートしています。クローンしたモデルリポジトリのクイックスキャン:mdd ./downloaded-model --out ./audit。ローカルGGUFファイルのスキャン:mdd ~/models/qwen.gguf --out ./audit-qwen。インストール済みのOllamaモデルを名前でスキャン:mdd-ollama qwen3:4b --out ./audit-qwen3-ollama。--fail-onパラメータを設定すると、リスクレベルが指定したレベル以上の場合にコマンドが非ゼロで終了します。

全体として、Model Due Diligence はAIモデルのサプライチェーンセキュリティのための実用的で拡張可能な静的解析フレームワークを提供します。これはランタイムテストや専門的なセキュリティ監査に取って代わるものではありませんが、モデル導入パイプラインの最初の防御線として重要な役割を果たします。