Biztonságos Többoldalú Számításra Épülő AI a Bizalmas Szállítói Kérdőív Válaszokhoz
Bevezetés
A biztonsági kérdőívek a B2B SaaS szerződések kapujaiként szolgálnak. Részletes információkat kérnek az infrastruktúráról, az adatkezelésről, a incidenskezelésről és a megfelelőségi kontrollokról. A szállítóknak gyakran több tucat ilyen kérdőívet kell negyedévente kitölteniük, ahol minden egyes kérés olyan bizonyítékot igényel, amely érzékeny belső adatokat tartalmazhat — architektúra-diagramok, privilegizált hitelesítő adat vagy szabadalmaztatott folyamatleírások.
A hagyományos AI‑alapú automatizálás, mint például a Procurize AI Engine, jelentősen felgyorsítja a válaszgenerálást, de általában központos hozzáférést igényel a nyers forrásanyagra. Ez a központosítás két fő kockázatot hordoz:
- Adatkiáramlás — Ha az AI‑modell vagy a mögöttes tároló kompromittálódik, a bizalmas vállalati információk szivároghatnak.
- Szabályozási nem‑megfelelés — Az olyan szabályozások, mint a GDPR, a CCPA és a felbukkanó adat‑szuverenitási törvények korlátozzák, hogy hol és hogyan dolgozható fel személyes vagy szabadalmaztatott adat.
Bemutatkozik a Biztonságos Többoldalú Számítás (SMPC) — egy kriptográfiai protokoll, amely lehetővé teszi, hogy több fél közösen számítson egy függvényt a bemeneteik felett, miközben ezek a bemenetek privátok maradnak. Az SMPC-t a generatív AI‑val kombinálva pontos, auditálható kérdőív válaszokat hozhatunk létre, anélkül, hogy a nyers adatot valaha is átadnánk az AI‑modellnek vagy egyetlen feldolgozó csomópontnak.
Ez a cikk a technikai alapokat, a gyakorlati megvalósítási lépéseket és az üzleti előnyöket mutatja be egy Secure‑SMPC‑AI csővezetékben, amely a Procurize platformra van szabva.
Fő tanulság: Az SMPC‑kiegészített AI a automatizálás sebességét és a nulla‑ismeret titoktartását hozza, átalakítva a SaaS vállalatok kérdőív‑válaszolási folyamatát.
1. A Biztonságos Többoldalú Számítás Alapjai
A Biztonságos Többoldalú Számítás lehetővé teszi, hogy egy résztvevői halmaz – mindegyiknek saját privát bemenete – közösen számítson egy f függvényt úgy, hogy:
- Helyesség — Minden fél megkapja a helyes kimenetet f(x₁, x₂, …, xₙ).
- Titoktartás — Senki sem tanul semmit a többiek bemeneteiről, csak azt, ami a kimenetből logikusan következtethető.
Az SMPC protokollok két fő csoportra oszthatók:
| Protokoll | Fő ötlet | Tipikus felhasználási eset |
|---|---|---|
| Titkos Megosztás (Shamir, additív) | Minden bemenetet véletlenszerű részletekre osztják, amelyeket minden fél kap. A számítás a részleteken történik; a rekonstrukció adja az eredményt. | Nagy mátrix műveletek, adatvédő elemzések. |
| Titkosított Áramkörök | Egy fél (a garbler) titkosít egy logikai áramkört; a kiértékelő futtatja az áramkört titkosított bemenetekkel. | Bináris döntési függvények, biztonságos összehasonlítások. |
Az általunk vizsgált szöveg kinyerés, szemantikus hasonlóság és bizonyíték‑összeállítás feladatokhoz az additív titkos megosztás a legjobban skálázható, mivel hatékonyan kezeli a magas dimenziós vektoroperációkat a modern MPC‑keretrendszerek, mint a MP‑SPDZ, CrypTen vagy Scale‑MPC segítségével.
2. Architektúra Áttekintés
Az alábbi magas szintű Mermaid diagram szemlélteti a SMPC‑kiegészített AI teljes körű folyamatát a Procurize‑on belül.
graph TD
A["Adat Tulajdonos (Vállalat)"] -->|Titkosít és megoszt| B["SMPC Csomópont 1 (AI Számítás)"]
A -->|Titkosít és megoszt| C["SMPC Csomópont 2 (Szabálytár)"]
A -->|Titkosít és megoszt| D["SMPC Csomópont 3 (Audit Napló)"]
B -->|Biztonságos vektor műveletek| E["LLM Inference (Titkosított)"]
C -->|Szabálylekérdezés| E
D -->|Bizonyítvány generálás| F["Zero‑Knowledge Audit Bizonyíték"]
E -->|Titkosított válasz| G["Válasz Aggregátor"]
G -->|Dekódolt válasz| H["Szállítói Kérdőív UI"]
F -->|Audit nyomvonal| H
Az egyes komponensek magyarázata
- Adat Tulajdonos (Vállalat) – A vállalat birtokolja a szellemi tulajdont tartalmazó dokumentumokat (pl. SOC 2 jelentések, architektúra‑diagrámok). Mielőtt bármi feldolgozásra kerülne, a tulajdonos titkos‑megosztja a dokumentumokat három titkos részesre, és eljuttatja őket az SMPC csomópontokhoz.
- SMPC Csomópontok – Függetlenül számolnak a részekkel.
- Csomópont 1 futtatja a LLM‑inferencia motort (pl. finomhangolt Llama‑2) titkosított környezetben.
- Csomópont 2 tárolja a szabály‑tudás gráfot (ISO 27001 kontrollok) szintén titkos‑megosztva.
- Csomópont 3 egy immutábilis audit‑naplót (blockchain vagy csak‑hozzáfűzhető log) vezet, amely a kérések metaadatait rögzíti anélkül, hogy nyers adatot árulna el.
- LLM Inference (Titkosított) – A modell a titkosított beágyazott vektorokból dolgozik, titkosított válaszvektorokat hoz létre, és visszaküldi őket az aggregátornak.
- Válasz Aggregátor – A végső dekódolás csak a teljes számítás befejeződése után történik, így nem lép fel köztes adatlopás.
- Zero‑Knowledge Audit Bizonyíték – A Csomópont 3 kriptográfiai bizonyítékot (zk‑SNARK) állít elő, amely igazolja, hogy a válasz a meghatározott szabály‑források alapján keletkezett, anélkül, hogy a forrásokat felfedné.
3. Részletes Munkafolyamat
3.1 Befogadás és Titkos Megosztás
- Dokumentum normalizálás – PDF‑ek, Word‑fájlok és forráskódrészletek átalakítása egyszerű szöveggé, tokenizálás.
- Beágyazás generálás – Egy könnyű enkóder (pl. MiniLM) sűrű vektorokat hoz létre minden bekezdéshez.
- Additív titkos megosztás – Minden vektor v esetén generálunk véletlen részeket v₁, v₂, v₃, úgy, hogy
v = v₁ + v₂ + v₃ (mod p). - Elosztás – A részeket TLS‑en keresztül a három SMPC csomóponthoz továbbítjuk.
3.2 Biztonságos Szabály‑Kontekst Lekérdezés
- A szabály‑tudás gráf (kontrollok, ISO 27001‑térképek) szintén titkos‑megosztott formában tárolódik.
- Amikor egy kérdés érkezik (pl. „Írja le az adat‑tárolás titkosítását”), a rendszer biztonságos halmaz‑metszetet alkalmaz a releváns szabály‑klauzulák megtalálásához, anélkül, hogy a teljes gráfot felfedné.
3.3 Titkosított LLM Inference
- A titkosított beágyazott vektorok és a lekérdezett szabály‑vektorok egy privát‑transzformerbe kerülnek, amely a részekkel dolgozik.
- A FHE‑barát attention vagy MPC‑optimalizált softmax technikák segítségével a legvalószínűbb választoken‑sorozatot számítják ki a titkosított tartományban.
3.4 Rekonstrukció és Audit‑Bizonyíték
- A titkosított válasstoken‑ek elkészülnek, a Válasz Aggregátor összeadja a részeket, és így megkapja a nyers szöveget.
- Egyidejűleg a Csomópont 3 Zero‑Knowledge Succinct Non‑interactive Argument of Knowledge (zk‑SNARK)‑ot állít elő, amely bizonyítja, hogy a válasz:
- A helyes szabály‑klauzulát használta.
- Nem szivárgott ki nyers dokumentuminformáció.
3.5 Kiszállítás a Végfelhasználónak
- A végső válasz megjelenik a Procurize UI‑ben egy kriptográfiai bizonyíték jelvény mellett.
- Az auditorok a nyilvános ellenőrző kulcs segítségével ellenőrizhetik a jelvényt, biztosítva a megfelelőséget anélkül, hogy a háttérdokumentumokat kérnénk le.
4. Biztonsági Garanciák
| Kockázat | SMPC‑AI Mitigáció |
|---|---|
| Adatkiáramlás az AI‑szolgáltatástól | A nyers adatok soha nem hagyják el a tulajdonos környezetét; csak titkos részek kerülnek továbbításra. |
| Belső fenyegetések a felhőszolgáltatónál | Egyetlen csomópont sem birtokolja a teljes adatot; a rekonstrukcióhoz (≥ 2 a 3‑ból) szükséges kollektív együttműködés. |
| Modellek kinyerési támadások | Az LLM csak titkosított bemenetekkel dolgozik; a támadók nem tudnak tetszőleges adatot a modellnek beadni. |
| Szabályozói auditok | A zk‑SNARK bizonyíték bizonyítja a megfelelőséget, miközben tiszteletben tartja az adat‑lokalitási követelményeket. |
| Man‑in‑the‑Middle | Minden csatorna TLS‑védett; a titkos megosztás a szállítási biztonságtól független kriptográfiai függetlenséget biztosít. |
5. Teljesítmény‑szempontok
Bár az SMPC növeli a számítási terhelést, a modern optimalizációk a kérdőív‑automatizáláshoz még mindig elfogadható válaszidőket biztosítanak:
| Metrika | Hagyományos AI | SMPC‑AI (3‑csomópont) |
|---|---|---|
| Inferencia késleltetés | ~1,2 s válaszonként | ~3,8 s válaszonként |
| Áteresztőképesség | 120 válasz/perc | 45 válasz/perc |
| Számítási költség | 0,25 CPU‑óra/1 k válasz | 0,80 CPU‑óra/1 k válasz |
| Hálózati forgalom | < 5 MB/válasz | ~12 MB/válasz (titkos részek) |
Főbb optimalizálások:
- Kötegzés — Több kérdés egyidejű feldolgozása ugyanazon részekkel.
- Hibrid protokoll — Nagy lineáris műveletekhez titkos megosztás, nem lineáris műveletekhez garbált áramkörök.
- Edge telepítés — Legalább egy SMPC csomópont helyi (on‑prem) üzemeltetése csökkenti a felhőben történő bizalom szükségességét.
6. Integráció a Procurize‑ba
A Procurize jelenleg biztosítja:
- Dokumentum tároló – Központosított hely a megfelelőségi anyagoknak.
- Kérdőív‑építő – UI a kérdések tervezéséhez, kiosztásához és nyomon követéséhez.
- AI Engine – Finomhangolt LLM a válaszgeneráláshoz.
Az SMPC‑AI bevezetéséhez:
- SMPC mód engedélyezése – Az adminisztrátor egy kapcsolót állít be a platform beállításaiban.
- SMPC csomópontok kiosztása – Három Docker konténer (Node 1‑3) telepítése a hivatalos
procurize/smpc-nodeképből. A konténerek automatikusan regisztrálódnak az orchestrációs réteghez. - Szabály‑gráf definiálása – Exportálja a meglévő szabály‑térképet JSON‑LD‑ben; a platform titkosítja és elosztja.
- Audit‑bizonyítékok beállítása – Adj meg egy nyilvános ellenőrző kulcsot; a UI automatikusan megjeleníti a bizonyíték‑jelvényeket.
- Biztonságos LLM betanítása – Ugyanazzal az adathalmazzal, mint a standard AI motor. A betanítás off‑chain történik, de a modell súlyait a Node 1 sealed enclave‑ben (pl. Intel SGX) tölti be a további védelem érdekében.
7. Valós Példa: FinTech Szállítói Audit
Cég: FinFlow, egy közepes méretű FinTech SaaS szolgáltató.
Problémája: Negyedéves auditok a banki partnerek részéről teljes adat‑tárolás titkosítási részleteket követeltek. A titkosítási kulcsok és kulcs‑kezelési politika bizalmas, ezért nem volt lehetséges egy külső AI‑szolgáltatáshoz feltölteni.
Megoldás:
- A FinFlow SMPC‑AI csomópontokat telepített – Node 1 Azure Confidential Compute‑on, Node 2 helyi adatközpontban, Node 3 Hyperledger Fabric peer‑ként.
- A titkosítási politika dokumentumát (5 MB) titkos‑megosztott formában küldte a csomópontoknak.
- A “Kulcs‑rotáció ütemtervének leírása” kérdésre 4,2 másodperc alatt válaszolt, egy verifikálható bizonyítékkal.
- A banki auditorok a nyilvános kulccsal ellenőrizték a bizonyítékot, megerősítve, hogy a válasz a FinFlow belső politikájából származik, anélkül, hogy a politika részleteit látták volna.
Eredmény: Az audit átfutási idő 7 napról 2 órára csökkent, és semmi adatvédelmi incidens nem történt.
8. Jövőbeli Iránymutatások
| Fejlesztési Tétel | Várható Hatás |
|---|---|
| Federált SMPC több szállító között | Lehetővé teszi a közös benchmark‑készítést anélkül, hogy a szabadalmaztatott adatot megosztanák. |
| Dinamikus szabály‑frissítés on‑chain governance‑del | Azonnali szabály‑változások tükröződnek az SMPC számításban. |
| Zero‑Knowledge kockázati értékelés | Kvantitatív kockázati pontszámok generálása, amelyek kriptográfiai módon bizonyíthatók. |
| AI‑generált megfelelőségi narratívák | Kiterjeszti a igen/nem válaszokat teljes körű, provokatív magyarázatokra, miközben titokban maradnak az adatok. |
Következtetés
A Biztonságos Többoldalú Számítás integrálása a generatív AI‑val privát, auditálható és skálázható megoldást nyújt a biztonsági kérdőív‑válaszok automatizálásához. Három kulcsfontosságú igényt elégít ki a modern SaaS vállalatok számára:
- Sebesség – A válaszgenerálás közel valós időben történik, felgyorsítva a szerződéskötési folyamatot.
- Biztonság – A bizalmas adatok soha nem hagyják el a tulajdonos környezetét, megvédve a szivárgástól és a szabályozási megsértéstől.
- Bizalom – A kriptográfiai bizonyítékok garantálják, hogy a válasz a meghatározott belső szabályok alapján jött létre.
Az SMPC‑AI beépítésével a Procurize‑ba a vállalatok egy versenyelőnyt szerezhetnek, amely felgyorsítja a szerződéskötést, miközben a legmagasabb adatvédelmi sztenderdeket tartja tiszteletben.
