機密ベンダーアンケート回答のためのSMPC活用AI

はじめに

セキュリティアンケートは B2B SaaS 契約のゲートキーパーです。インフラ、データ取扱い、インシデント対応、コンプライアンス管理に関する詳しい情報を求められます。ベンダーは四半期ごとに数十件ものアンケートに回答する必要があり、その際に 機密内部データ（アーキテクチャ図、特権認証情報、独自プロセスの記述）を含む証拠が要求されることがあります。

従来の AI 主導の自動化、たとえば Procurize AI Engine は回答生成を劇的に高速化しますが、通常は 生データへの集中アクセス を必要とします。この集中化は次の二つの大きなリスクをもたらします。

データ流出 – AIモデルや基盤ストレージが侵害されると、機密企業情報が外部に漏れる可能性があります。
規制違反 – GDPR、CCPA、そして新興のデータ主権法などは、個人情報や独自データの処理場所・方法を厳格に制限しています。

そこで登場するのが Secure Multiparty Computation (SMPC) です。複数の参加者がそれぞれの入力を秘密に保ちつつ、共同で関数を計算できる暗号プロトコルです。SMPC と生成AI を融合すれば、AIモデルや任意の単一処理ノードに生データを一切見せることなく、正確かつ監査可能なアンケート回答を生成できます。

本稿では、Procurize プラットフォーム向けに設計された Secure‑SMPC‑AI パイプラインの技術的基盤、実装手順、ビジネス上のメリットを詳しく解説します。

重要ポイント：SMPC 強化 AI は 自動化のスピード と ゼロ知識のプライバシー保証 を同時に提供し、SaaS 企業がセキュリティアンケートに回答する方法を根本から変革します。

1. Secure Multiparty Computation の基礎

Secure Multiparty Computation は、各参加者がプライベートな入力を保持したまま、関数 f を共同計算し、次を保証します。

正確性 – 全参加者が正しい出力 f(x₁, x₂, …, xₙ) を取得できる。
プライバシー – 出力から推測できる範囲を除き、他者の入力については一切漏洩しない。

SMPC プロトコルは大きく二つの系統に分かれます。

プロトコル	主なアイデア	典型的なユースケース
シークレットシェアリング（Shamir、加法）	各入力をランダムなシェアに分割し、全パーティへ配布。計算はシェア上で行い、再構成で結果を得る。	大規模行列演算、プライバシ保護分析
ガーブルド回路	一方のパーティ（ガーバー）がブール回路を暗号化し、評価者が暗号化入力で回路を実行する。	バイナリ比較、判定関数

テキスト抽出・意味的類似性・証拠合成という本ユースケースでは、加法シークレットシェアリング がベクトル演算のスケーラビリティ面で最適です。MP‑SPDZ、CrypTen、Scale‑MPC といった最新 MPC フレームワークが対応しています。

2. アーキテクチャ概要

以下は Procurize 内での SMPC‑活用 AI のエンドツーエンドフローを示す Mermaid 図です。

  graph TD
    A["データ所有者（企業）"] -->|暗号化＆分割| B["SMPC ノード1（AI 計算）"]
    A -->|暗号化＆分割| C["SMPC ノード2（ポリシー保存）"]
    A -->|暗号化＆分割| D["SMPC ノード3（監査台帳）"]
    B -->|安全なベクトル演算| E["LLM 推論（暗号化）"]
    C -->|ポリシー取得| E
    D -->|証明生成| F["ゼロ知識監査証明"]
    E -->|暗号化回答| G["回答集約器"]
    G -->|復号された回答| H["ベンダーアンケート UI"]
    F -->|監査トレイル| H

コンポーネントの説明

データ所有者（企業） – SOC 2 レポートやアーキテクチャ図などの機密文書を保持。処理前に各文書を シークレットシェア し、3 つの暗号化シャードを SMPC ノードへ配布します。
SMPC ノード –
- ノード1：暗号化された埋め込みベクトルを受け取り、Fine‑tuned Llama‑2 等の LLM を暗号下で実行。
- ノード2：ISO 27001 などのポリシー知識グラフを同様にシークレットシェアし保持。
- ノード3：不変監査台帳（ブロックチェーンまたは Append‑Only ログ）として、リクエストメタデータを記録しつつ生データは公開しません。
LLM 推論（暗号化） – 暗号化埋め込みと取得したポリシーベクトルを入力とし、暗号化された回答ベクトルを生成。
回答集約器 – 全計算が完了した後にシェアを合算し、平文の回答を復元。途中の情報は一切漏洩しません。
ゼロ知識監査証明 – ノード3 が生成し、回答が所定のポリシーソースに基づいて導出されたことを証明。ソース自体は公開しません。

3. 詳細ワークフロー

3.1 取り込みとシークレットシェア

文書正規化 – PDF、Word、コードスニペットを平文に変換しトークナイズ。
埋め込み生成 – MiniLM 等の軽量エンコーダで各段落を高次元ベクトルに変換。
加法シークレット分割 – 各ベクトル v についてランダムシェア v₁, v₂, v₃ を生成し、v = v₁ + v₂ + v₃ (mod p) を満たすようにします。
配布 – TLS 経由で三つの SMPC ノードへシェアを送信。

3.2 ポリシーコンテキストの安全取得

ポリシー知識グラフ（制御項目と標準マッピング）は暗号化されたまま各ノードに保持されます。アンケート項目が到着したら（例: “データ・アット・レスト暗号化を説明してください”）安全な集合交差 を用いて関連ポリシー条項を取得し、全体を公開せずに必要情報だけを抽出します。

3.3 暗号化 LLM 推論

暗号化埋め込みと取得したポリシーベクトルを 秘密分散上のトランスフォーマー に入力し、FHE フレンドリー注意機構 と MPC 最適化ソフトマックス を組み合わせて暗号化トークン列を生成します。

3.4 復号と監査証明生成

暗号化トークンが完成したら、回答集約器 がシェアを合算し平文回答を復元。同時にノード3 が zk‑SNARK を生成し、以下を証明します。

正しいポリシー条項が選択されたこと
生データが単一ノードに漏れなかったこと

3.5 エンドユーザーへの提示

最終的な回答は Procurize UI に表示され、暗号証明バッジが添付されます。監査者は公開検証キーでバッジを確認でき、内部文書を提供せずにコンプライアンスを証明できます。

4. セキュリティ保証

脅威	SMPC‑AI による対策
AIサービスからのデータ流出	生データは所有者環境に留まり、SMPC ノードへはシェアのみ送信
クラウドプロバイダー内部者脅威	任意の単一ノードでは完全データが取得できず、復元には 2/3 以上の協調が必要
モデル抽出攻撃	LLM は暗号化入力のみを受け取り、任意データでのクエリが不可能
規制監査	zk‑SNARK 証明により、データ所在地・処理方法を開示せずにコンプライアンスを証明
中間者攻撃	全通信は TLS で保護し、秘密分散により輸送層の安全性に依存しない

5. パフォーマンス考慮点

指標	従来 AI（平文）	SMPC‑AI（3ノード）
推論レイテンシ	約 1.2 秒/回答	約 3.8 秒/回答
スループット	120 回答/分	45 回答/分
計算コスト	0.25 CPU‑hour/1k 回答	0.80 CPU‑hour/1k 回答
ネットワークトラフィック	< 5 MB/回答	≈ 12 MB/回答（暗号シェア）

主な最適化策

バッチ処理 – 複数アンケート項目を同時にシェアで処理
ハイブリッドプロトコル – 線形演算はシークレットシェア、非線形はガーブルド回路に切り替え
エッジ配置 – 1 つの SMPC ノードをオンプレミスに配置し、外部クラウドへの信頼を低減

6. Procurize との統合

Procurize が既に提供している機能:

文書リポジトリ – コンプライアンス証拠の集中管理
アンケートビルダー – UI での質問作成・割当・追跡
AI エンジン – ファインチューニング済み LLM による回答生成

SMPC‑AI を組み込む手順:

SMPC モード有効化 – 管理画面のフラグをオンにする。
SMPC ノードのプロビジョニング – procurize/smpc-node Docker イメージを 3 つデプロイ（ノード 1–3）。自動的に Orchestrator に登録されます。
ポリシーグラフ定義 – 既存のポリシーマッピングを JSON‑LD にエクスポートし、プラットフォームが暗号化・分割して各ノードへ配布。
監査証明設定 – 公開検証キーを提供し、UI が自動で証明バッジを表示。
Secure LLM のロード – 標準 AI エンジンと同じデータセットで学習したモデルを、シークレットシェア上で動作する SGX 封印エンクレーブにロード。

7. 実例: FinTech ベンダー監査

企業：FinFlow（中規模 FinTech SaaS）

課題：銀行パートナーからの四半期監査で、データ・アット・レスト暗号化 の詳細を求められたが、暗号鍵管理ポリシーは機密情報で外部 AI に渡せなかった。

導入：

SMPC‑AI ノードを構築
- ノード1：Azure Confidential Compute VM
- ノード2：社内データセンター
- ノード3：Hyperledger Fabric ピア
暗号鍵管理文書（5 MB）をシークレットシェアし各ノードへ配布。
「鍵ローテーションスケジュールを説明してください」という質問に対し、4.2 秒 で回答生成、かつ検証可能な証明が付与された。

結果：監査完了までの期間が 7 日間 → 2 時間 に短縮。機密情報の漏洩は一切発生せず、コンプライアンス違反ゼロ を維持。

8. 今後の展開

ロードマップ項目	期待される効果
複数ベンダー間のフェデレーティブ SMPC	企業間ベンチマークをデータ共有せずに実施
オンチェーンガバナンスでの動的ポリシー更新	ポリシー変更が即座に SMPC 計算に反映
ゼロ知識リスクスコアリング	暗号化データから導出されたリスクスコアを証明付きで提供
AI 生成コンプライアンス記述の拡張	Yes/No だけでなく、完全な説明文をプライバシ保護しつつ生成

結論

Secure Multiparty Computation と生成AI を組み合わせることで、プライバシー重視・監査可能・スケーラブル なセキュリティアンケート自動化が実現します。これにより、現代 SaaS 企業が直面する スピード、セキュリティ、信頼 の三大課題を同時に解決でき、競争優位性を獲得できます。Procurize に SMPC‑AI を統合すれば、手作業のボトルネックを高速化しつつ、最も厳しいプライバシー基準にも適合した形で契約締結プロセスを加速させることが可能です。

参考情報

Procurize Blog: AI‑Powered Compliance Integration Into CI/CD Workflows