Sikker Multiparty Computation‑drevet AI til Fortrolige Leverandørspørgeskema‑svar

Introduktion

Sikkerhedsspørgeskemaer er portvagtere for B2B SaaS‑kontrakter. De anmoder om detaljeret information om infrastruktur, datahåndtering, hændelsesrespons og overholdelseskontroller. Leverandører skal ofte besvare dusinvis af sådanne spørgeskemaer pr. kvartal, hver med krav om beviser, der kan indeholde følsomme interne data—arkitekturdiagrammer, priviligerede legitimationsoplysninger eller proprietære procesbeskrivelser.

Traditionel AI‑drevet automatisering, som Procurize AI Engine, accelererer svargenereringen markant, men kræver typisk centraliseret adgang til det rå kilde materiale. Denne centralisering introducerer to store risici:

  1. Dataudslip – Hvis AI‑modellen eller den underliggende lagring kompromitteres, kan fortrolige virksomhedsoplysninger blive afsløret.
  2. Regulatorisk Ikke‑Overholdelse – Regler som GDPR, CCPA, og nye datasuverænitet‑love begrænser hvor og hvordan personlige eller proprietære data kan behandles.

Indfør Secure Multiparty Computation (SMPC)—en kryptografisk protokol, der gør det muligt for flere parter at beregne en funktion over deres input, mens inputtene forbliver private. Ved at kombinere SMPC med generativ AI kan vi producere præcise, auditérbare svar på spørgeskemaer uden nogensinde at afsløre rådata til AI‑modellen eller nogen enkelt behandlingsnode.

Denne artikel udforsker de tekniske grundlag, praktiske implementeringstrin og forretningsmæssige fordele ved en Secure‑SMPC‑AI‑pipeline, skræddersyet til Procurize‑platformen.

Vigtig pointe: SMPC‑forstærket AI leverer automatiseringens hastighed og privatlivsgarantierne fra zero‑knowledge, og omformer, hvordan SaaS‑virksomheder svarer på sikkerhedsspørgeskemaer.

1. Grundlæggende om Secure Multiparty Computation

Secure Multiparty Computation gør det muligt for et sæt deltagere, hver med et privat input, at beregne en fælles funktion f, så:

  • Korrekthed – Alle parter modtager det korrekte output f(x₁, x₂, …, xₙ).
  • Privatliv – Ingen part lærer noget om de andres input, ud over hvad der kan udledes fra outputtet.

SMPC‑protokoller findes i to hovedfamilier:

ProtokolHovedidéTypisk Anvendelse
Secret Sharing (Shamir, additive)Del hver input i tilfældige andele, der distribueres til alle parter. Beregning udføres på andelene; rekonstruktion giver resultatet.Store matrixoperationer, privatlivsbevarende analyse.
Garbled CircuitsEn part (garbleren) krypterer et boolesk kredsløb; evaluatoren kører kredsløbet ved hjælp af krypterede input.Binære beslutningsfunktioner, sikre sammenligninger.

For vores scenario—tekstudtræk, semantisk lighed og evidenssyntese—er additiv hemmelig deling den mest skalerbare tilgang, da den håndterer høj‑dimensionelle vektoroperationer effektivt ved brug af moderne MPC‑rammer som MP‑SPDZ, CrypTen eller Scale‑MPC.

2. Arkitekturoversigt

Herunder er et overordnet Mermaid‑diagram, der illustrerer end‑to‑end‑flowet af SMPC‑forstærket AI i Procurize.

  graph TD
    A["Dataejer (Firma)"] -->|Krypter & Del| B["SMPC Node 1 (AI Compute)"]
    A -->|Krypter & Del| C["SMPC Node 2 (Policy Store)"]
    A -->|Krypter & Del| D["SMPC Node 3 (Audit Ledger)"]
    B -->|Sikre Vektor‑Ops| E["LLM Inference (Krypteret)"]
    C -->|Policy‑Hentning| E
    D -->|Bevis‑Generering| F["Zero‑Knowledge Audit Proof"]
    E -->|Krypteret Svar| G["Svar‑Aggregator"]
    G -->|Afsløret Svar| H["Leverandør‑spørgeskema‑UI"]
    F -->|Audit‑Spor| H

Forklaring af komponenter

  • Dataejer (Firma) – Besidder proprietære dokumenter (fx SOC 2‑rapporter, arkitekturdiagrammer). Før nogen behandling delejer ejeren hvert dokument i tre krypterede fragmenter og distribuerer dem til SMPC‑noderne.
  • SMPC‑noder – Beregner uafhængigt på andele. Node 1 kører LLM‑inference‑motoren (fx en fin‑tuned Llama‑2‑model) under kryptering. Node 2 indeholder policy‑vidensgrafer (fx ISO 27001‑kontroller) også secret‑shared. Node 3 vedligeholder en uforanderlig audit‑ledger (blockchain eller append‑only‑log), der registrerer anmodningsmetadata uden at afsløre rådata.
  • LLM‑Inference (Krypteret) – Modellen modtager krypterede indlejringer afledt af de revne dokumenter, producerer krypterede svarvektorer og returnerer dem til aggregatoren.
  • Svar‑Aggregator – Rekonstruerer klartekst‑svaret først, når hele beregningen er færdig, for at sikre ingen mellemliggende lækage.
  • Zero‑Knowledge‑audit‑bevis – Genereret af Node 3 for at bevise, at svaret er afledt fra de udpegede policy‑kilder uden at afsløre selve kilderne.
  • Leverandør‑spørgeskema‑UI – Viser de afslørede svar til leverandørspørgeskemaet.

3. Detaljeret Arbejdsgang

3.1 Ingestion & Secret Sharing

  1. Dokumentnormalisering – PDF‑, Word‑filer og kildekode‑uddrag konverteres til ren tekst og tokeniseres.
  2. Indlejring‑generering – En letvægts‑encoder (fx MiniLM) skaber tætte vektorer for hvert afsnit.
  3. Additiv hemmelig deling – For hver vektor v, genereres tilfældige andele v₁, v₂, v₃, så v = v₁ + v₂ + v₃ (mod p).
  4. Distribution – Andelene sendes over TLS til de tre SMPC‑noder.

3.2 Sikker Hentning af Policy‑Kontekst

  • Policy‑vidensgrafen (kontroller, mapping til standarder) findes krypteret på tværs af noderne.
  • Når et spørgeskema‑element ankommer (fx “Beskriv din datalagrings‑kryptering”), forespørger systemet grafen ved hjælp af sikker mængde‑intersection for at lokalisere relevante policy‑klausuler uden at frigive hele grafen.

3.3 Krypteret LLM‑Inference

  • De krypterede indlejringer og hentede policy‑vektorer fødes ind i en privatlivs‑bevarende transformer, der opererer på hemmelige andele.
  • Teknikker som FHE‑venlig attention eller MPC‑optimeret softmax beregner den mest sandsynlige svar‑token‑sekvens i det krypterede domæne.

3.4 Rekonstruktion & Audit‑Bevis

  • Når de krypterede svar‑tokens er klar, rekonstruerer Svar‑Aggregatoren klartekst‑svaret ved at summere andelene.
  • Samtidigt genererer Node 3 et Zero‑Knowledge Succinct Non‑interactive Argument of Knowledge (zk‑SNARK), der bekræfter, at svaret overholder:
    • Den korrekte policy‑klausul‑udvælgelse.
    • Ingen lækage af rå dokumentindhold.

3.5 Levering til Slutbruger

  • Det endelige svar vises i Procurize‑UI’en sammen med en kryptografisk bevis‑badge.
  • Revisorer kan verificere badge’en ved brug af en offentlig verifikationsnøgle, så overholdelse sikres uden at anmode om de underliggende dokumenter.

4. Sikkerhedsgarantier

TrusselSMPC‑AI‑afhjælpning
Dataudslip fra AI‑tjenesteRådata forlader aldrig ejerens miljø; kun hemmelige andele overføres.
Indside‑trussel hos cloud‑udbyderIngen enkelt node har et komplet overblik; kollusionsgrænsen (≥ 2 ud af 3) er nødvendig for at rekonstruere data.
Model‑ekstraktionsangrebLLM‑en kører på krypterede input; angribere kan ikke forespørge modellen med vilkårlige data.
Regulatoriske revisionerzk‑SNARK‑bevis viser overholdelse, mens det respekterer datalokalitets‑krav.
Man‑in‑the‑Middle‑angrebAlle kanaler er TLS‑beskyttede; hemmelig deling tilføjer kryptografisk uafhængighed fra transport‑sikkerhed.

5. Ydelsesovervejelser

MålingBaseline (Standard AI)SMPC‑AI (3‑node)
Inference‑latens~1,2 s pr. svar~3,8 s pr. svar
Gennemløb120 svar/min45 svar/min
Beregningsomkostning0,25 CPU‑time/1k svar0,80 CPU‑time/1k svar
Netværkstrafik< 5 MB/svar~12 MB/svar (krypterede andele)

Nøgleoptimeringer

  • Batching – Behandl flere spørgeskema‑elementer parallelt på de samme andele.
  • Hybrid Protokol – Brug secret sharing til tung lineær algebra, skift kun til garblerede kredsløb for ikke‑lineære funktioner (fx sammenligninger).
  • Edge‑implementering – Deploy én SMPC‑node lokalt (fx inden for virksomhedens firewall) for at reducere tillid til eksterne clouds.

6. Integration med Procurize

Procurize tilbyder allerede:

  • Dokumentarkiv – Centraliseret lagring af compliance‑artefakter.
  • Spørgeskema‑bygger – UI til at oprette, tildele og spore spørgeskemaer.
  • AI‑motor – Fin‑tuned LLM til svargenerering.

For at indarbejde SMPC‑AI:

  1. Aktiver SMPC‑tilstand – Administratoren tænder en flag i platformens indstillinger.
  2. Provisionér SMPC‑noder – Deploy tre Docker‑containere (Node 1–3) med den officielle procurize/smpc-node‑image. Containerne registrerer sig automatisk i platformens orkestreringslag.
  3. Definér policy‑graf – Eksporter eksisterende policy‑mappinger til en JSON‑LD‑graf; platformen krypterer og distribuerer den.
  4. Konfigurer audit‑beviser – Angiv en offentlig verifikationsnøgle; UI’en vil automatisk vise bevis‑badges.
  5. Træn sikker LLM – Brug det samme datasæt som den standard‑AI‑motor; træning foregår off‑chain, men de resulterende model‑vægt­ninger indlæses i Node 1 i en forseglet enclave (fx Intel SGX) for ekstra sikkerhed.

7. Real‑World Use Case: FinTech Vendor Audit

Virksomhed: FinFlow, en mellemstørrelse FinTech SaaS‑leverandør.

Udfordring: Kvartalsvise revisioner fra bankpartnere krævede fulde detaljer om datalagrings‑kryptering. Deres krypteringsnøgler og nøglehåndterings‑politikker er klassificerede og kan ikke uploades til en tredjeparts AI‑tjeneste.

Løsning

  1. FinFlow implementerede SMPC‑AI‑noder—Node 1 i en Azure Confidential Compute‑VM, Node 2 lokalt, Node 3 som en Hyperledger Fabric‑peer.
  2. Krypterings‑policy‑dokumentet (5 MB) blev secret‑shared på tværs af noderne.
  3. Spørgeskema‑elementet “Beskriv nøgle‑rotationsplan” blev besvaret på 4,2 sekunder med et verificerbart bevis.
  4. Bankens revisorer verificerede beviset ved brug af den offentlige nøgle, hvilket bekræftede, at svaret stammede fra FinFlows interne policy uden nogensinde at se selve policy’en.

Resultat: Revisionstiden faldt fra 7 dage til 2 timer, og ingen overtrædelser af overholdelse blev rapporteret.

8. Fremtidige Retninger

Køreplan‑punktForventet Virkning
Fødereret SMPC på tværs af flere leverandørerMuliggør fælles benchmarking uden at dele proprietære data.
Dynamisk policy‑opdatering med on‑chain governanceTillader øjeblikkelige policy‑opdateringer, der afspejles i SMPC‑beregningen.
Zero‑Knowledge risikoscoreringProducerer kvantitative risikoscorer, der beviseligt er afledt fra krypterede data.
AI‑genererede compliance‑narrativerUdvider ud over ja/nej-svar til fuldlængde‑forklaringer, mens privatliv bevares.

Konklusion

Sikker Multiparty Computation, når den kombineres med generativ AI, tilbyder en privatliv‑først, audit‑bar og skalerbar løsning til automatisering af svar på sikkerhedsspørgeskemaer. Den opfylder tre kritiske krav fra moderne SaaS‑virksomheder:

  1. Hastighed – Næsten real‑tid svargenerering reducerer forretningsfriktion.
  2. Sikkerhed – Fortrolige data forlader aldrig deres retmæssige ejer, hvilket beskytter mod lækager og regulatoriske overtrædelser.
  3. Tillid – Kryptografiske beviser giver kunder og revisorer sikkerhed i, at svarene er forankret i verificerede interne policies.

Ved at indlejre SMPC‑AI i Procurize kan organisationer omdanne en traditionelt manuel flaskehals til en konkurrencefordel, som muliggør hurtigere kontraktlukninger, samtidig med at de højeste privatlivsstandarder opretholdes.

Se også

til toppen
Vælg sprog