Federirani graf znanja s nultim povjerenjem za automatizaciju upitnika za više zakupnika

Uvod

Sigurnosni i usklađeni upitnici stalna su uska grla za SaaS dobavljače. Svaki dobavljač mora odgovoriti na stotine pitanja koja obuhvaćaju više okvira — SOC 2, ISO 27001, GDPR, i industrijske standarde. Ručni napor potreban za pronalaženje dokaza, provjeru njihove relevantnosti i prilagođavanje odgovora svakom kupcu brzo postaje troškovni centar.

Federirani graf znanja (FKG) — distribuirana, shematski bogata reprezentacija dokaza, politika i kontrola — nudi način za uklanjanje tog uskog vrata. U kombinaciji s sigurnošću nultog povjerenja, FKG može sigurno opsluživati mnoge zakupnike (različite poslovne jedinice, podružnice ili partnerske organizacije) bez ikada izlaganja podataka koji pripadaju drugom zakupniku. Rezultat je više‑zakupnički, AI‑potaknuti sustav za automatizaciju upitnika koji:

Aggregira dokaze iz različitih spremišta (Git, cloud storage, CMDB‑i).
Provodi stroge politike pristupa na razini čvora i veze (nulto povjerenje).
Orkestrira AI‑generirane odgovore putem Retrieval‑Augmented Generation (RAG) koji koriste samo znanje odobreno za danog zakupnika.
Bilježi porijeklo i reviziju kroz nepromjenjivi ledger.

U ovom članku detaljno razrađujemo arhitekturu, protok podataka i korake implementacije za izgradnju takvog sustava na vrhu Procurize AI platforme.

1. Osnovni pojmovi

Pojam	Što znači za automatizaciju upitnika
Zero Trust	“Nikada ne vjeruj, uvijek provjeri.” Svaki zahtjev prema grafu je autentificiran, autoriziran i kontinuirano ocjenjivan prema politikama.
Federirani graf znanja	Mreža nezavisnih graf‑čvorova (svaki u vlasništvu jednog zakupnika) koji dijele zajedničku shemu, ali svoje podatke fizički izoliraju.
RAG (Retrieval‑Augmented Generation)	Generiranje odgovora putem LLM‑a koje najprije dohvaća relevantne dokaze iz grafa prije sastavljanja odgovora.
Neponovljivi ledger	Pohrana samo za dodavanje (npr. blockchain‑stil Merkle stabla) koja bilježi svaku promjenu dokaza, osiguravajući otkrivanje manipulacije.

2. Pregled arhitekture

Dolje je visokorazinski Mermaid dijagram koji prikazuje glavne komponente i njihovu međusobnu interakciju.

  graph LR
    subgraph Tenant A
        A1[Policy Store] --> A2[Evidence Nodes]
        A2 --> A3[Access Control Engine<br>(Zero Trust)]
    end
    subgraph Tenant B
        B1[Policy Store] --> B2[Evidence Nodes]
        B2 --> B3[Access Control Engine<br>(Zero Trust)]
    end
    subgraph Federated Layer
        A3 <--> FK[Federated Knowledge Graph] <--> B3
        FK --> RAG[Retrieval‑Augmented Generation]
        RAG --> AI[LLM Engine]
        AI --> Resp[Answer Generation Service]
    end
    subgraph Audit Trail
        FK --> Ledger[Immutable Ledger]
        Resp --> Ledger
    end
    User[Questionnaire Request] -->|Auth Token| RAG
    Resp -->|Answer| User

Ključni zaključci iz dijagrama

Izolacija zakupnika – Svaki zakupnik ima svoju Politiku i Čvorove Dokaza, a Motor za kontrolu pristupa medijira sve zahtjeve između zakupnika.
Federirani graf – Čvor FK agregira metapodatke sheme dok su stvarni dokazi šifrirani i razdvojeni.
Provjere nultog povjerenja – Svaki pristup prolazi kroz Motor za kontrolu pristupa koji ocjenjuje kontekst (uloga, stanje uređaja, svrha zahtjeva).
Integracija AI‑a – RAG komponenta povlači samo one čvorove dokaza kojima je zakupnik ovlašten, a zatim ih predaje LLM‑u za sintezu odgovora.
Revizija – Sva preuzimanja i generirani odgovori zapisuju se u neponovljivom ledgeru za revizore.

3. Model podataka

3.1 Unified Schema

Entitet	Atributi	Primjer
Policy	`policy_id`, `framework`, `section`, `control_id`, `text`	`SOC2-CC6.1`
Evidence	`evidence_id`, `type`, `location`, `checksum`, `tags`, `tenant_id`	`evid-12345`, `log`, `s3://bucket/logs/2024/09/01.log`
Relationship	`source_id`, `target_id`, `rel_type`	`policy_id -> evidence_id` (evidence_of)
AccessRule	`entity_id`, `principal`, `action`, `conditions`	`evidence_id`, `user:alice@tenantA.com`, `read`, `device_trusted==true`

Svi entiteti pohranjeni su kao property graphs (npr. Neo4j ili JanusGraph) i izloženi putem GraphQL‑kompatibilnog API‑ja.

3.2 Jezik politika nultog povjerenja

Lagan DSL (Domain Specific Language) opisuje finu granularnost pravila:

allow(user.email =~ "*@tenantA.com")
  where action == "read"
    and entity.type == "Evidence"
    and entity.tenant_id == "tenantA"
    and device.trust_score > 0.8;

Ova pravila se kompajliraju u stvarne politike koje provodi Motor za kontrolu pristupa u stvarnom vremenu.

4. Radni tijek: od pitanja do odgovora

Uzimanje pitanja – Sigurnosni revizor učitava upitnik (PDF, CSV ili API JSON). Procurize ga parsira u pojedinačna pitanja i mapira svako na jedan ili više kontrola okvira.
Mapiranje kontrola‑dokaza – Sustav upitom prema FKG‑u traži veze koje povezuju ciljnu kontrolu s čvorovima dokaza koji pripadaju zahtjevnom zakupniku.
Autorizacija nultog povjerenja – Prije bilo kojeg preuzimanja dokaza, Motor za kontrolu pristupa validira kontekst zahtjeva (korisnik, uređaj, lokacija, vrijeme).
Preuzimanje dokaza – Ovlašteni dokazi se strimaju ka RAG modulu. RAG rangira dokaze po relevantnosti koristeći hibridni TF‑IDF + embedding sličnost model.

Generiranje od strane LLM‑a – LLM prima pitanje, preuzete dokaze i predložak prompta koji nameće ton i jezik usklađenosti. Primjer prompta:

You are a compliance specialist for {tenant_name}. Answer the following security questionnaire item using ONLY the supplied evidence. Do not fabricate details.
Question: {question_text}
Evidence: {evidence_snippet}

Pregled i suradnja – Generirani odgovor prikazuje se u Procurize‑ovom real‑time suradničkom UI‑ju gdje stručnjaci mogu komentirati, uređivati ili odobravati.
Bilježenje revizije – Svako preuzimanje, generiranje i uređivanje dodatno se dodaje u neponovljivi ledger s kriptografskim hash‑om koji povezuje na verziju izvornog dokaza.

5. Sigurnosne garancije

Prijetnja	Ublažavanje
Curanje podataka između zakupnika	Kontrola nultog povjerenja nameće `tenant_id` podudaranje; svi prijenosi su end‑to‑end šifrirani (TLS 1.3 + Mutual TLS).
Kompromitacija vjerodajnica	Kratkoročni JWT‑ovi, attestation uređaja i kontinuirano ocjenjivanje rizika (behavioural analytics) poništavaju token pri otkrivanju anomalija.
Manipulacija dokazima	Neponovljivi ledger koristi Merkle proof‑e; svaka izmjena izaziva nepodudaranje koje je vidljivo revizorima.
Halucinacije modela	RAG ograničava LLM da koristi samo preuzete dokaze; verifikator nakon generiranja provjerava da li postoje neosnovane tvrdnje.
Napadi na lanac opskrbe	Svi ekstenziji grafa (plugin‑i, konektori) su potpisani i provjereni kroz CI/CD koji izvršava statičku analizu i SBOM provjere.

6. Koraci implementacije na Procurize

Postavite čvorove grafa za svakog zakupnika
- Implementirajte zasebnu Neo4j instancu po zakupniku (ili koristite multi‑tenant bazu s row‑level security).
- Učitajte postojeće politike i dokaze putem Procurize‑ovih import kanala.
Definirajte pravila nultog povjerenja
- Koristite Procurize‑ov editor politika za pisanje DSL pravila.
- Omogućite integraciju device posture (MDM, endpoint detection) za dinamičke risk ocjene.
Konfigurirajte federiranu sinkronizaciju
- Instalirajte micro‑service procurize-fkg-sync.
- Konfigurirajte ga da objavljuje ažuriranja sheme u zajednički schema registry uz zadržavanje podataka enkriptiranih u mirovanju.
Integrirajte RAG pipeline
- Deployajte kontejner procurize-rag (uključuje vector store, Elasticsearch i fin‑tuned LLM).
- Spojite RAG endpoint s FKG GraphQL API‑jem.
Aktivirajte neponovljivi ledger
- Omogućite modul procurize-ledger (koristi Hyperledger Fabric ili lagani Append‑Only Log).
- Postavite politike zadržavanja sukladno regulatornim zahtjevima (npr. 7‑godišnji audit trail).
Omogućite suradničko UI
- Uključite funkciju Real‑Time Collaboration.
- Definirajte role‑based view dozvole (Reviewer, Approver, Auditor).
Pokrenite pilot
- Odaberite upitnik visokog volumena (npr. SOC 2 Type II) i izmjerite:
  - Vrijeme obrade (baseline vs. AI‑augmented).
  - Točnost (postotak odgovora koji prolaze auditor provjeru).
  - Smanjenje troškova usklađenosti (ušteđeni FTE sati).

7. Sažetak poslovnih koristi

Poslovna korist	Tehnički rezultat
Brzina – Smanjenje vremena odgovora na upitnik s dana na minute.	RAG dohvaća relevantne dokaze < 250 ms; LLM generira odgovor < 1 s.
Smanjenje rizika – Eliminacija ljudskih grešaka i curenja podataka.	Kontrole nultog povjerenja i neponovljivi log garantiraju da se koriste samo ovlašteni dokazi.
Skalabilnost – Podrška stotinama zakupnika bez dupliciranja podataka.	Federirani graf izolira pohranu, dok zajednička shema omogućuje analitiku preko zakupnika.
Spremnost za reviziju – Pružanje dokaziva traga za regulatore.	Svaki odgovor je povezan s kriptografskim hash‑om točno verzije dokaza.
Učinkovitost troškova – Smanjenje operativnih troškova usklađenosti.	Automatizacija smanjuje ručni rad do 80 %, oslobađajući sigurnosne timove za strateški rad.

8. Buduća poboljšanja

Federirano učenje za fino podešavanje LLM‑a – Svaki zakupnik može doprinijeti anonimiziranim gradijentima kako bi poboljšao domeno‑specifični LLM bez izlaganja sirovih podataka.
Generiranje politika kao koda – Automatsko stvaranje Terraform ili Pulumi modula koji primjenjuju iste zero‑trust politike u cloud infrastrukturi.
Overlayi Explainable AI – Vizualizacija puta razmišljanja (dokaz → prompt → odgovor) izravno u UI‑ju pomoću Mermaid sekvencijskih dijagrama.
Integracija Zero‑Knowledge Proof (ZKP) – Dokazivanje regulatorima da je određena kontrola zadovoljena bez otkrivanja samog dokaza.

9. Zaključak

Federirani graf znanja s nultim povjerenjem transformira zamorno, izolirano okruženje upravljanja sigurnosnim upitnicima u siguran, kolaborativan i AI‑potpomognut tok rada. Kombinacijom grafova izoliranih po zakupniku, finog granuliranja politika pristupa, Retrieval‑Augmented Generation i neponovljivog zapisa, organizacije mogu brže, točnije i s potpunom regulatornom sigurnošću odgovarati na usklađenost pitanja.

Implementacija ove arhitekture na Procurize AI platformi koristi postojeće kanale za ingestiranje podataka, alate za suradnju i sigurnosne primitive – omogućujući timovima da se usredotoče na strateško upravljanje rizicima umjesto na ponavljajuće prikupljanje podataka.

Budućnost usklađenosti je federirana, pouzdana i inteligentna. Prigrlite je danas i ostanite ispred revizora, partnera i regulatora.