AI News HubLIVE
サイト内リライト6 分で読了

WeaviateによるエンタープライズAIの保護

架空のMedVector Health社の事例を通じて、OIDC、RBAC、マルチテナント分離、監査ログ、ネットワークセキュリティを使用してWeaviateのエンタープライズデプロイメントを保護し、HIPAA、GDPRなどのコンプライアンス要件を満たす方法を詳しく説明します。

ソースWeaviate Blog

現代のエンタープライズ環境では、AIセキュリティは単に保護レイヤーを追加するだけでなく、既存のアイデンティティインフラストラクチャと深く統合する必要があります。Weaviateは主要なベクトルデータベースとして、OIDC認証、RBAC承認、マルチテナント分離、監査ログ、ネットワークセキュリティなど、包括的なセキュリティフレームワークを提供します。

エンタープライズセキュリティが異なる理由

Weaviateセキュリティの入門ガイドでは、APIキー、OIDCの基本、ロールベースのアクセス制御などの基礎を説明しました。これらの構成要素は導入には役立ちますが、エンタープライズ環境には異なる課題があります:多数のユーザーが複数のチームにわたって存在すること、規制コンプライアンス(GDPR、HIPAA、SOC 2、PCI DSS、FedRAMP)、そしてベクトルデータベースが既に投資したアイデンティティインフラと統合されることを期待することです。

具体例として、架空のヘルステック企業MedVector Healthを取り上げます。同社はWeaviate上にAI駆動の臨床検索ツールを構築しました。初期段階では5人のエンジニアが2つのAPIキーを共有していましたが、うまく機能していました。しかし、最初の病院クライアントを獲得し、40人を追加雇用し、コンプライアンスチームからHIPAA監査が6ヶ月後に行われると連絡が来た時、問題が顕在化しました。当初の2つのAPIキーは気づけば12に増え、Slackメッセージや.envファイルに散らばっていました。契約社員の契約が終了した際、どのキーにアクセス権があったのか誰も確信が持てませんでした。

以下は、MedVectorがスタートアップレベルのセキュリティからエンタープライズグレードへと移行した方法、そして各セキュリティレイヤーが監査人が最終的に尋ねる具体的な質問にどのように答えたかです。

1. エンタープライズ認証のためのOIDC統合

監査人の質問:「ユーザーはどのように認証されますか?データベースが侵害された場合、資格情報はどうなりますか?」

MedVectorが最初に行ったのは、Weaviateを既存のアイデンティティプロバイダー(IdP)に接続することでした。Slackで共有APIキーをやり取りする必要はなくなりました。監査人が最終的に資格情報の保存について尋ねた時、答えは簡単でした。「私たちは資格情報を保存しません。認証はIdPに委任されています。」

OpenID Connect(OIDC)はWeaviateにおけるエンタープライズ認証の基盤です。OIDCを採用することで、Weaviateは独立した資格情報ストアを作成する必要がなくなり、代わりに既存のIdPと統合します。

OIDCのセキュリティワークフロー:

  • 委任認証:ユーザーはWeaviateではなくIdPで認証します。
  • トークンベースのアクセス:IdPは短期間有効で暗号署名されたJSON Webトークン(JWT)を生成します。
  • ゼロ知識:Weaviateはトークンを検証しますが、ユーザーの資格情報を閲覧または保存することはありません。

このアーキテクチャは攻撃対象領域を大幅に削減します。データベースが侵害されたとしても、盗むべきパスワードはなく、有効期限切れか短期間のトークンだけが存在し、それら単独では無価値です。

Weaviateは、Okta、Microsoft Entra ID(Azure AD)、Auth0、Google Workspace、Keycloakなど、すべてのOIDC準拠のIdPをサポートしています。

2. エンタープライズRBACの拡張

監査人の質問:「誰が患者記録にアクセスできますか?最小権限の原則を証明できますか?」

MedVectorの最初の病院クライアントは、患者向け検索アプリが医学文献をクエリできても、保護健康情報(PHI)には決して触れないことを要求しました。これにより、MedVectorは単純なロール割り当てを超え、厳格なアクセスマトリックスを定義する必要が生じました。

基本的なロール割り当てを超えて、エンタープライズには現実の複雑さを処理する認可ポリシーが必要です:複数チームがインフラを共有する、厳格なデータ分離要件、一貫して適用される最小権限の原則。

MedVectorは3つのコレクションを管理しており、それぞれ敏感度レベルが異なります:

  • MedicalArticles:公開されている医学文献
  • PatientRecords:HIPAAの対象となるPHI
  • dev collections:開発および実験環境、本番データから隔離

最小権限モデルは次のとおりです: | ロール | MedicalArticles | PatientRecords | Dev Collections | RBACロール管理 | | --- | --- | --- | --- | --- | | RoleManager | アクセスなし | アクセスなし | アクセスなし | ✅ | | Clinician | 読み取りのみ | 完全CRUD | アクセスなし | ❌ | | Researcher | 読み取りのみ | アクセスなし | 完全CRUD | ❌ | | ClinicalSearchApp | 読み取りのみ | アクセスなし | アクセスなし | ❌ |

この設定では、患者向け検索アプリケーション(ClinicalSearchApp)は医学記事のみを照会でき、患者記録へのアクセスは完全にありません。研究者はモデル用に公開文献を読むことはできますが、患者記録には触れられません。資格情報が侵害されても、影響範囲はその特定のロールの権限に限定されます。

3. OIDCグループ:ロール管理の拡大

監査人の質問:「社内で従業員の役割が変わった場合、アクセス権はどのくらいの速さで更新されますか?」

従業員数が80人に達した時、MedVectorは手動でWeaviateロールを割り当てていましたが、遅れが生じ始めました。Chen医師が臨床チームから研究チームに異動した際、古い権限が2週間も残っていました。彼らには現実と同期したアクセス権が必要でした。

OIDCグループは、既存の組織構造をWeaviateロールに直接マッピングすることでこの問題を解決します。IdPはどのユーザーがどのチームに属しているかを既に認識しています。Weaviateがこれらのグループクレームを信頼するように設定できます。IdP内でユーザーのグループメンバーシップが変更されると(昇進やチーム移動など)、Weaviateは次回接続時に自動的に権限変更を反映します。

IdPグループをWeaviateロールにマッピングした後、Chen医師の問題は解消されました。IdPで彼女をClinical-StaffからResearch-Teamに移動するだけで、Weaviateの権限が次回接続時に自動更新され、手動介入はゼロでした。

4. マルチテナントセキュリティ

監査人の質問:「病院Aのスタッフは病院Bの記録にアクセスできますか?」

MedVectorが2つ目の病院クライアントと契約した時、病院Aの患者データが病院Bから見えないことを保証する必要がありました。各顧客に個別のWeaviateクラスターを立ち上げることなく。

多くのエンタープライズデプロイメントは、Weaviateのマルチテナンシー機能を使用して、共有コレクション内で異なる顧客、部門、またはビジネスユニットのデータを分離します。RBACはマルチテナンシーと統合され、テナントレベルのアクセス制御を提供します。

5. 監査ログとコンプライアンス

監査人の質問:「過去90日間のPHIアクセスのすべてのインスタンスを見せてください。」

6ヶ月後、監査人が到着しました。MedVectorは監査ログをエクスポートし、コレクション「PatientRecords」でフィルタリングし、すべてのアクセス、すべてのユーザー、すべての決定を含む完全なトレイルを提供しました。監査は合格しました。

規制業界では、立証責任はあなたにあります。すべてをログに記録する必要があります。GDPRは処理活動の記録を要求し、HIPAAはすべてのPHIアクセスの監査証跡を要求し、SOC 2は機密データアクセス監視の証拠を要求します。

Weaviateは包括的な監査ログを提供し、認証イベント(成功と失敗)、RBACチェック(権限許可または拒否のたび)、ロール変更(誰がいつ権限を変更したか)、および完全なコンテキスト付きのデータアクセスを追跡します。

6. ネットワークセキュリティ

監査人の質問:「患者データは公共インターネットを経由しますか?」

監査が終了した後、MedVectorは最後のコンプライアンスチェック項目に取り組みました。その質問に対する答えが明確に「ノー」であることを確認することです。

認証と認可は論理的なアクセスを保護しますが、エンタープライズデプロイメントではネットワークレベルのアクセスも保護する必要があります。Weaviate Cloud DedicatedデプロイメントはAWS PrivateLinkをサポートしており、アプリケーションとWeaviate間のトラフィックが公共インターネットを経由しないことを保証します。

セルフホストデプロイメントでは、標準的なネットワークセキュリティのベストプラクティスが適用されます:TLS終端を備えたリバースプロキシまたはロードバランサーの背後にWeaviateを配置し、ファイアウォールルールやKubernetesネットワークポリシーでネットワークアクセスを制限し、WeaviateのTLS構成を使用して転送中のトラフィックを暗号化します。

実装ロードマップ

MedVectorが共有APIキーからHIPAA監査合格に至る道のりは、予測可能なライフサイクルに従いました。以下は一般化した同じパスです:

  1. 発見:データの機密レベルをマッピングすることから始めます。PII、規制データ、またはIP機密情報を含むWeaviateコレクションを特定します。
  2. アーキテクチャ:最小権限の原則に従い、Weaviateでカスタムロールを定義します。
  3. 統合:IdPでOIDCを構成し、エンドツーエンドのトークンフローをテストします。
  4. テスト:IdPグループにユーザーを追加すると適切なWeaviate権限が付与され、削除すると権限が取り消されることを確認します。
  5. 運用:SIEMへのログ転送を構成し、「アクセス拒否」の急増、管理ロール変更、異常なアクセスパターンに関するアラートを設定します。

結論

エンタープライズセキュリティは分離ではなく統合に関するものです。Weaviateは既存のIdPとの統合、OIDCグループによる組織構造の尊重、コンプライアンス対応の監査証跡の提供を通じて、エンタープライズのニーズに応えます。このガイドでカバーされた主要なエンタープライズセキュリティ機能には以下が含まれます:OIDC統合、自動プロビジョニングと失効を備えたOIDCグループ、きめ細かいRBAC、マルチテナントセキュリティ、監査ログ、ネットワークセキュリティ(PrivateLink、VPC Peering、TLS暗号化)、エンタープライズチーム向けSSOを備えたクラウドデプロイメントオプション。

MedVectorは5人のエンジニアから複数病院プラットフォームに成長する過程でデータベースを置き換えるのではなく、必要に応じてセキュリティ機能を積み重ねました。あなたも同じことができます。基本的なRBACから始め、IdP統合に発展させ、完全な監査ログに成熟させることができます。すべて同じプラットフォーム上で。