Biztonságos Többoldalú Számításra Épülő AI a Bizalmas Szállítói Kérdőív Válaszokhoz

Bevezetés

A biztonsági kérdőívek a B2B SaaS szerződések kapujaiként szolgálnak. Részletes információkat kérnek az infrastruktúráról, az adatkezelésről, a incidenskezelésről és a megfelelőségi kontrollokról. A szállítóknak gyakran több tucat ilyen kérdőívet kell negyedévente kitölteniük, ahol minden egyes kérés olyan bizonyítékot igényel, amely érzékeny belső adatokat tartalmazhat — architektúra-diagramok, privilegizált hitelesítő adat vagy szabadalmaztatott folyamatleírások.

A hagyományos AI‑alapú automatizálás, mint például a Procurize AI Engine, jelentősen felgyorsítja a válaszgenerálást, de általában központos hozzáférést igényel a nyers forrásanyagra. Ez a központosítás két fő kockázatot hordoz:

Adatkiáramlás — Ha az AI‑modell vagy a mögöttes tároló kompromittálódik, a bizalmas vállalati információk szivároghatnak.
Szabályozási nem‑megfelelés — Az olyan szabályozások, mint a GDPR, a CCPA és a felbukkanó adat‑szuverenitási törvények korlátozzák, hogy hol és hogyan dolgozható fel személyes vagy szabadalmaztatott adat.

Bemutatkozik a Biztonságos Többoldalú Számítás (SMPC) — egy kriptográfiai protokoll, amely lehetővé teszi, hogy több fél közösen számítson egy függvényt a bemeneteik felett, miközben ezek a bemenetek privátok maradnak. Az SMPC-t a generatív AI‑val kombinálva pontos, auditálható kérdőív válaszokat hozhatunk létre, anélkül, hogy a nyers adatot valaha is átadnánk az AI‑modellnek vagy egyetlen feldolgozó csomópontnak.

Ez a cikk a technikai alapokat, a gyakorlati megvalósítási lépéseket és az üzleti előnyöket mutatja be egy Secure‑SMPC‑AI csővezetékben, amely a Procurize platformra van szabva.

Fő tanulság: Az SMPC‑kiegészített AI a automatizálás sebességét és a nulla‑ismeret titoktartását hozza, átalakítva a SaaS vállalatok kérdőív‑válaszolási folyamatát.

1. A Biztonságos Többoldalú Számítás Alapjai

A Biztonságos Többoldalú Számítás lehetővé teszi, hogy egy résztvevői halmaz – mindegyiknek saját privát bemenete – közösen számítson egy f függvényt úgy, hogy:

Helyesség — Minden fél megkapja a helyes kimenetet f(x₁, x₂, …, xₙ).
Titoktartás — Senki sem tanul semmit a többiek bemeneteiről, csak azt, ami a kimenetből logikusan következtethető.

Az SMPC protokollok két fő csoportra oszthatók:

Protokoll	Fő ötlet	Tipikus felhasználási eset
Titkos Megosztás (Shamir, additív)	Minden bemenetet véletlenszerű részletekre osztják, amelyeket minden fél kap. A számítás a részleteken történik; a rekonstrukció adja az eredményt.	Nagy mátrix műveletek, adatvédő elemzések.
Titkosított Áramkörök	Egy fél (a garbler) titkosít egy logikai áramkört; a kiértékelő futtatja az áramkört titkosított bemenetekkel.	Bináris döntési függvények, biztonságos összehasonlítások.

Az általunk vizsgált szöveg kinyerés, szemantikus hasonlóság és bizonyíték‑összeállítás feladatokhoz az additív titkos megosztás a legjobban skálázható, mivel hatékonyan kezeli a magas dimenziós vektoroperációkat a modern MPC‑keretrendszerek, mint a MP‑SPDZ, CrypTen vagy Scale‑MPC segítségével.

2. Architektúra Áttekintés

Az alábbi magas szintű Mermaid diagram szemlélteti a SMPC‑kiegészített AI teljes körű folyamatát a Procurize‑on belül.

  graph TD
    A["Adat Tulajdonos (Vállalat)"] -->|Titkosít és megoszt| B["SMPC Csomópont 1 (AI Számítás)"]
    A -->|Titkosít és megoszt| C["SMPC Csomópont 2 (Szabálytár)"]
    A -->|Titkosít és megoszt| D["SMPC Csomópont 3 (Audit Napló)"]
    B -->|Biztonságos vektor műveletek| E["LLM Inference (Titkosított)"]
    C -->|Szabálylekérdezés| E
    D -->|Bizonyítvány generálás| F["Zero‑Knowledge Audit Bizonyíték"]
    E -->|Titkosított válasz| G["Válasz Aggregátor"]
    G -->|Dekódolt válasz| H["Szállítói Kérdőív UI"]
    F -->|Audit nyomvonal| H

Az egyes komponensek magyarázata

Adat Tulajdonos (Vállalat) – A vállalat birtokolja a szellemi tulajdont tartalmazó dokumentumokat (pl. SOC 2 jelentések, architektúra‑diagrámok). Mielőtt bármi feldolgozásra kerülne, a tulajdonos titkos‑megosztja a dokumentumokat három titkos részesre, és eljuttatja őket az SMPC csomópontokhoz.
SMPC Csomópontok – Függetlenül számolnak a részekkel.
- Csomópont 1 futtatja a LLM‑inferencia motort (pl. finomhangolt Llama‑2) titkosított környezetben.
- Csomópont 2 tárolja a szabály‑tudás gráfot (ISO 27001 kontrollok) szintén titkos‑megosztva.
- Csomópont 3 egy immutábilis audit‑naplót (blockchain vagy csak‑hozzáfűzhető log) vezet, amely a kérések metaadatait rögzíti anélkül, hogy nyers adatot árulna el.
LLM Inference (Titkosított) – A modell a titkosított beágyazott vektorokból dolgozik, titkosított válaszvektorokat hoz létre, és visszaküldi őket az aggregátornak.
Válasz Aggregátor – A végső dekódolás csak a teljes számítás befejeződése után történik, így nem lép fel köztes adatlopás.
Zero‑Knowledge Audit Bizonyíték – A Csomópont 3 kriptográfiai bizonyítékot (zk‑SNARK) állít elő, amely igazolja, hogy a válasz a meghatározott szabály‑források alapján keletkezett, anélkül, hogy a forrásokat felfedné.

3. Részletes Munkafolyamat

3.1 Befogadás és Titkos Megosztás

Dokumentum normalizálás – PDF‑ek, Word‑fájlok és forráskódrészletek átalakítása egyszerű szöveggé, tokenizálás.
Beágyazás generálás – Egy könnyű enkóder (pl. MiniLM) sűrű vektorokat hoz létre minden bekezdéshez.
Additív titkos megosztás – Minden vektor v esetén generálunk véletlen részeket v₁, v₂, v₃, úgy, hogy v = v₁ + v₂ + v₃ (mod p).
Elosztás – A részeket TLS‑en keresztül a három SMPC csomóponthoz továbbítjuk.

3.2 Biztonságos Szabály‑Kontekst Lekérdezés

A szabály‑tudás gráf (kontrollok, ISO 27001‑térképek) szintén titkos‑megosztott formában tárolódik.
Amikor egy kérdés érkezik (pl. „Írja le az adat‑tárolás titkosítását”), a rendszer biztonságos halmaz‑metszetet alkalmaz a releváns szabály‑klauzulák megtalálásához, anélkül, hogy a teljes gráfot felfedné.

3.3 Titkosított LLM Inference

A titkosított beágyazott vektorok és a lekérdezett szabály‑vektorok egy privát‑transzformerbe kerülnek, amely a részekkel dolgozik.
A FHE‑barát attention vagy MPC‑optimalizált softmax technikák segítségével a legvalószínűbb választoken‑sorozatot számítják ki a titkosított tartományban.

3.4 Rekonstrukció és Audit‑Bizonyíték

A titkosított válasstoken‑ek elkészülnek, a Válasz Aggregátor összeadja a részeket, és így megkapja a nyers szöveget.
Egyidejűleg a Csomópont 3 Zero‑Knowledge Succinct Non‑interactive Argument of Knowledge (zk‑SNARK)‑ot állít elő, amely bizonyítja, hogy a válasz:
- A helyes szabály‑klauzulát használta.
- Nem szivárgott ki nyers dokumentuminformáció.

3.5 Kiszállítás a Végfelhasználónak

A végső válasz megjelenik a Procurize UI‑ben egy kriptográfiai bizonyíték jelvény mellett.
Az auditorok a nyilvános ellenőrző kulcs segítségével ellenőrizhetik a jelvényt, biztosítva a megfelelőséget anélkül, hogy a háttérdokumentumokat kérnénk le.

4. Biztonsági Garanciák

Kockázat	SMPC‑AI Mitigáció
Adatkiáramlás az AI‑szolgáltatástól	A nyers adatok soha nem hagyják el a tulajdonos környezetét; csak titkos részek kerülnek továbbításra.
Belső fenyegetések a felhőszolgáltatónál	Egyetlen csomópont sem birtokolja a teljes adatot; a rekonstrukcióhoz (≥ 2 a 3‑ból) szükséges kollektív együttműködés.
Modellek kinyerési támadások	Az LLM csak titkosított bemenetekkel dolgozik; a támadók nem tudnak tetszőleges adatot a modellnek beadni.
Szabályozói auditok	A zk‑SNARK bizonyíték bizonyítja a megfelelőséget, miközben tiszteletben tartja az adat‑lokalitási követelményeket.
Man‑in‑the‑Middle	Minden csatorna TLS‑védett; a titkos megosztás a szállítási biztonságtól független kriptográfiai függetlenséget biztosít.

5. Teljesítmény‑szempontok

Bár az SMPC növeli a számítási terhelést, a modern optimalizációk a kérdőív‑automatizáláshoz még mindig elfogadható válaszidőket biztosítanak:

Metrika	Hagyományos AI	SMPC‑AI (3‑csomópont)
Inferencia késleltetés	~1,2 s válaszonként	~3,8 s válaszonként
Áteresztőképesség	120 válasz/perc	45 válasz/perc
Számítási költség	0,25 CPU‑óra/1 k válasz	0,80 CPU‑óra/1 k válasz
Hálózati forgalom	< 5 MB/válasz	~12 MB/válasz (titkos részek)

Főbb optimalizálások:

Kötegzés — Több kérdés egyidejű feldolgozása ugyanazon részekkel.
Hibrid protokoll — Nagy lineáris műveletekhez titkos megosztás, nem lineáris műveletekhez garbált áramkörök.
Edge telepítés — Legalább egy SMPC csomópont helyi (on‑prem) üzemeltetése csökkenti a felhőben történő bizalom szükségességét.

6. Integráció a Procurize‑ba

A Procurize jelenleg biztosítja:

Dokumentum tároló – Központosított hely a megfelelőségi anyagoknak.
Kérdőív‑építő – UI a kérdések tervezéséhez, kiosztásához és nyomon követéséhez.
AI Engine – Finomhangolt LLM a válaszgeneráláshoz.

Az SMPC‑AI bevezetéséhez:

SMPC mód engedélyezése – Az adminisztrátor egy kapcsolót állít be a platform beállításaiban.
SMPC csomópontok kiosztása – Három Docker konténer (Node 1‑3) telepítése a hivatalos procurize/smpc-node képből. A konténerek automatikusan regisztrálódnak az orchestrációs réteghez.
Szabály‑gráf definiálása – Exportálja a meglévő szabály‑térképet JSON‑LD‑ben; a platform titkosítja és elosztja.
Audit‑bizonyítékok beállítása – Adj meg egy nyilvános ellenőrző kulcsot; a UI automatikusan megjeleníti a bizonyíték‑jelvényeket.
Biztonságos LLM betanítása – Ugyanazzal az adathalmazzal, mint a standard AI motor. A betanítás off‑chain történik, de a modell súlyait a Node 1 sealed enclave‑ben (pl. Intel SGX) tölti be a további védelem érdekében.

7. Valós Példa: FinTech Szállítói Audit

Cég: FinFlow, egy közepes méretű FinTech SaaS szolgáltató.

Problémája: Negyedéves auditok a banki partnerek részéről teljes adat‑tárolás titkosítási részleteket követeltek. A titkosítási kulcsok és kulcs‑kezelési politika bizalmas, ezért nem volt lehetséges egy külső AI‑szolgáltatáshoz feltölteni.

Megoldás:

A FinFlow SMPC‑AI csomópontokat telepített – Node 1 Azure Confidential Compute‑on, Node 2 helyi adatközpontban, Node 3 Hyperledger Fabric peer‑ként.
A titkosítási politika dokumentumát (5 MB) titkos‑megosztott formában küldte a csomópontoknak.
A “Kulcs‑rotáció ütemtervének leírása” kérdésre 4,2 másodperc alatt válaszolt, egy verifikálható bizonyítékkal.
A banki auditorok a nyilvános kulccsal ellenőrizték a bizonyítékot, megerősítve, hogy a válasz a FinFlow belső politikájából származik, anélkül, hogy a politika részleteit látták volna.

Eredmény: Az audit átfutási idő 7 napról 2 órára csökkent, és semmi adatvédelmi incidens nem történt.

8. Jövőbeli Iránymutatások

Fejlesztési Tétel	Várható Hatás
Federált SMPC több szállító között	Lehetővé teszi a közös benchmark‑készítést anélkül, hogy a szabadalmaztatott adatot megosztanák.
Dinamikus szabály‑frissítés on‑chain governance‑del	Azonnali szabály‑változások tükröződnek az SMPC számításban.
Zero‑Knowledge kockázati értékelés	Kvantitatív kockázati pontszámok generálása, amelyek kriptográfiai módon bizonyíthatók.
AI‑generált megfelelőségi narratívák	Kiterjeszti a igen/nem válaszokat teljes körű, provokatív magyarázatokra, miközben titokban maradnak az adatok.

Következtetés

A Biztonságos Többoldalú Számítás integrálása a generatív AI‑val privát, auditálható és skálázható megoldást nyújt a biztonsági kérdőív‑válaszok automatizálásához. Három kulcsfontosságú igényt elégít ki a modern SaaS vállalatok számára:

Sebesség – A válaszgenerálás közel valós időben történik, felgyorsítva a szerződéskötési folyamatot.
Biztonság – A bizalmas adatok soha nem hagyják el a tulajdonos környezetét, megvédve a szivárgástól és a szabályozási megsértéstől.
Bizalom – A kriptográfiai bizonyítékok garantálják, hogy a válasz a meghatározott belső szabályok alapján jött létre.

Az SMPC‑AI beépítésével a Procurize‑ba a vállalatok egy versenyelőnyt szerezhetnek, amely felgyorsítja a szerződéskötést, miközben a legmagasabb adatvédelmi sztenderdeket tartja tiszteletben.

Lásd még

Procurize Blog: AI‑Powered Compliance Integration Into CI/CD Workflows