Ekstrakcija dokaza višemedijskim AI-om za sigurnosna pitanja

Sigurnosni upitnici su vrata svakog B2B SaaS posla. Prodavači moraju dostaviti dokaze – PDF‑ove politika, arhitekturalne dijagrame, isječke koda, zapise revizija i čak snimke zaslona nadzornih ploča. Tradicionalno, timovi za sigurnost i usklađenost provode sate pretražujući repo‑zitorije, kopirajući datoteke i ručno ih prilažu poljima upitnika. Rezultat je usko grlo koje usporava prodajne cikluse, povećava ljudske pogreške i stvara revizijske praznine.

Procurize je već izgradio moćnu jedinstvenu platformu za upravljanje upitnicima, dodjelu zadataka i AI‑pomoć u generiranju odgovora. Sljedeća granica je automatizirati samu prikupljanje dokaza. Korištenjem višemedijskog generativnog AI‑a – modela koji razumiju tekst, slike, tablice i kod u jednoj cjevovodu – organizacije mogu trenutno izvući pravi artefakt za bilo koju stavku upitnika, bez obzira na format.

U ovom članku ćemo:

Objasniti zašto pristup jedne modalnosti (čisti tekstualni LLM‑ovi) ne zadovoljava moderne radne opterećenja usklađenosti.
Detaljno opisati arhitekturu motora za izvlačenje višemedijskih dokaza izgrađenog na vrhu Procurizea.
Pokazati kako trenirati, ocjenjivati i neprestano poboljšavati sustav tehnikama Generative Engine Optimization (GEO).
Prikazati konkretan krajnje‑do‑krajnjeg primjer, od pitanja sigurnosti do automatski priloženog dokaza.
Raspraviti o upravljanju, sigurnosti i revizijskim pitanjima.

Ključna pouka: Višemedijski AI pretvara dohvat dokaza iz ručnog zadatka u ponovljivu, revizijsku uslugu, skraćujući vrijeme obrade upitnika i do 80 % uz održavanje strogog usklađivanja.

1. Ograničenja tekst‑samo LLM‑ova u radnim tokovima upitnika

Većina današnje AI‑pokrivene automatizacije oslanja se na velike jezične modele (LLM‑ove) koji su izvrsni u generiranju teksta i semantičkoj pretrazi. Mogu izvući odlomke politika, sažeti revizijske izvještaje i čak sastaviti narativne odgovore. Međutim, dokazi za usklađenost rijetko su čisti tekst:

Vrsta dokaza	Uobičajeni format	Teškoća za LLM‑ove koji obrađuju samo tekst
Arhitekturalni dijagrami	PNG, SVG, Visio	Potrebno vizualno razumijevanje
Konfiguracijske datoteke	YAML, JSON, Terraform	Struktuirano, ali često ugniježđeno
Isječci koda	Java, Python, Bash	Potrebna je sintaktička svijest
Snimke zaslona nadzornih ploča	JPEG, PNG	Moraju se pročitati UI elementi i vremenske oznake
Tablice u PDF revizijskim izvještajima	PDF, skenirane slike	Potrebni OCR + parsiranje tablica

Kada pitanje glasi „Priložite dijagram mreže koji prikazuje protok podataka između vašeg proizvodnog i rezervnog okruženja”, model koji obrađuje samo tekst može odgovoriti jedino opisom; ne može locirati, provjeriti ni ugraditi stvarnu sliku. Ovaj jaz prisiljava korisnike na intervenciju, vraćajući ručni napor koji želimo eliminirati.

2. Arhitektura motora za izvlačenje višemedijskih dokaza

Dolje je prikazan visokorazinski dijagram predloženog motora, integriranog s jezgrama za upitnike Procurizea.

  graph TD
    A["Korisnik podnosi stavku upitnika"] --> B["Usluga klasifikacije pitanja"]
    B --> C["Orkestrator višemedijskog dohvaćanja"]
    C --> D["Tekstualna vektorska pohrana (FAISS)"]
    C --> E["Pohrana vektora slika (CLIP)"]
    C --> F["Pohrana vektora koda (CodeBERT)"]
    D --> G["Semantičko podudaranje (LLM)"]
    E --> G
    F --> G
    G --> H["Motor rangiranja dokaza"]
    H --> I["Obogaćivanje metapodataka usklađenosti"]
    I --> J["Automatsko prilaženje zadatku u Procurizeu"]
    J --> K["Provjera čovjek‑u‑petlji (HITL)"]
    K --> L["Unos revizijskog zapisa"]

2.1 Osnovne komponente

Usluga klasifikacije pitanja – fino podučeni LLM označava dolazna pitanja s vrstama dokaza (npr. „dijagram mreže“, „PDF politika sigurnosti“, „Terraform plan“).
Orkestrator višemedijskog dohvaćanja – na temelju klasifikacije usmjerava zahtjev prema odgovarajućim vektorskim pohranama.
Vektorske pohrane
- Tekstualna pohrana – FAISS indeks iz svih politika, revizijskih izvještaja i markdown datoteka.
- Pohrana slika – CLIP‑vektori generirani iz svakog dijagrama, snimke zaslona i SVG‑a pohranjenih u repozitoriju dokumenata.
- Pohrana koda – CodeBERT vektori za sve izvorne datoteke, CI/CD konfiguracije i IaC predloške.
Semantičko podudaranje – cross‑modalni transformer spaja upitni vektor s vektorima svake modalnosti i vraća rangiranu listu kandidata.
Motor rangiranja dokaza – primjenjuje GEO heuristike: svježina, stanje u sustavu za kontrolu verzija, relevantnost oznaka usklađenosti i modelov pouzdani rezultat.
Obogaćivanje metapodataka usklađenosti – dodaje SPDX licence, vremenske oznake revizije i oznake zaštite podataka svakom artefaktu.
Provjera čovjek‑u‑petlji (HITL) – UI u Procurizeu prikazuje tri najbolja prijedloga; recenzent može odobriti, zamijeniti ili odbiti.
Unos revizijskog zapisa – svako automatsko prilaženje se bilježi kriptografskim hash‑om, potpisom recenzenta i AI‑pouzdanjem, zadovoljavajući SOX i GDPR revizijske tragove.

2.2 Cjevovod za ingestiju podataka

Crawler pretražuje korporativne dijeljenje datoteka, Git repozitorije i oblak‑spremišta.
Pre‑procesor pokreće OCR na skeniranim PDF‑ovima (Tesseract), ekstrahira tablice (Camelot) i pretvara Visio datoteke u SVG.
Embedder generira vektore po modalnostima i pohranjuje ih s metapodacima (putanja, verzija, vlasnik).
Inkrementalno ažuriranje – mikro‑servis za otkrivanje promjena (watchdog) ponovno embedira samo izmijenjene artefakte, održavajući vektorske pohrane svježima u gotovo stvarnom vremenu.

3. Generative Engine Optimization (GEO) za dohvaćanje dokaza

GEO je sustavni pristup usavršavanju cijelog AI cjevovoda — ne samo jezičnog modela — tako da se krajnji KPI (vrijeme obrade upitnika) poboljša, a usklađenost ostane visoka.

GEO faza	Cilj	Ključni pokazatelji
Kvaliteta podataka	Osigurati da vektori odražavaju najnoviji položaj usklađenosti	% artefakata osvježenih < 24 h
Inženjering prompta	Osmišljavanje upita koji usmjeravaju model prema ispravnoj modalnosti	Povjerenje u rezultat dohvaćanja
Kalibracija modela	Poravnavanje povjerenja s prihvaćanjem recenzenta	Stopa lažnih pozitivnih < 5 %
Povratna sprega	Prikupljanje radnji recenzenta za fino podešavanje klasifikacije i rangiranja	Prosječno vrijeme odobrenja (MTTA)
Kontinuiranu evaluaciju	Noćna A/B testiranja na validacijskom setu povijesnih upitnika	Smanjenje prosječnog vremena odgovora

3.1 Primjer prompta za višemedijsko dohvaćanje

[QUESTION] Priložite najnoviji [SOC 2] Type II revizijski izvještaj koji pokriva šifriranje podataka u mirovanju.

[CONTEXT] Dohvatite PDF dokument koji sadrži relevantan odjeljak revizije. Vratite ID dokumenta, raspon stranica i kratki izvadak.

[MODALITY] text

Orkestrator parsira oznaku [MODALITY] i upit usmjerava isključivo tekstualnoj pohrani, značajno smanjujući šum iz slika ili koda.

3.2 Adaptivni pragovi

Korištenjem bayesijanske optimizacije, sustav automatski prilagođava prag pouzdanosti za svaku modalnost. Kada recenzenti dosljedno odobravaju prijedloge iznad 0,78 pouzdanosti za dijagrame, prag se podiže, smanjujući nepotrebne provjere. Suprotno tome, ako isječci koda često bivaju odbijeni, prag se spušta i generira se više kandidata.

4. Kraj‑do‑kraj primjer: od pitanja do automatski priloženog dokaza

4.1 Pitanje

„Priložite dijagram koji prikazuje protok podataka kupca od unosa do pohrane, uključujući točke šifriranja.“

4.2 Koraci

Korak	Radnja	Ishod
1	Korisnik kreira novu stavku upitnika u Procurizeu.	ID stavke `Q‑2025‑1123`.
2	Usluga klasifikacije označava upit kao `evidence_type: network diagram`.	Modalnost = slika.
3	Orkestrator šalje upit CLIP‑pohrani slika.	Vraća 12 kandidata vektora.
4	Semantičko podudaranje izračunava kosinusnu sličnost između upitnog vektora i svakog kandidata.	Top‑3 rezultati: 0,92; 0,88; 0,85.
5	Motor rangiranja procjenjuje svježinu (zadnja izmjena prije 2 dana) i oznake usklađenosti (sadrži “encryption”).	Konačni rang: dijagram `arch‑data‑flow‑v3.svg`.
6	HITL UI prikazuje dijagram s pregledom, metapodacima (autor, verzija, hash).	Recenzent klikne Odobri.
7	Sustav automatski prilaže dijagram stavci `Q‑2025‑1123` i bilježi revizijski zapis.	Revizijski zapis prikazuje AI‑pouzdanje 0,91, potpis recenzenta i vremensku oznaku.
8	Modul za generiranje odgovora sastavlja narativni odgovor koji referencira dijagram.	Gotov odgovor spreman za izvoz.

Ukupno vrijeme od koraka 1 do koraka 8 iznosi ≈ 45 sekundi, nasuprot tipičnih 15–20 minuta ručnog pronalaženja.

5. Upravljanje, sigurnost i revizijska trag

Automatizacija rukovanja dokazima postavlja legitimna pitanja:

Curenje podataka – usluge embediranja moraju raditi u Zero‑Trust VPC‑u s‑strogo definiranom IAM‑u. Nema vektora koji napuštaju korporativnu mrežu.
Kontrola verzija – svaki artefakt pohranjen je s Git commit hash‑om (ili verzijom objekta pohrane). Ako se dokument ažurira, stariji vektori se poništavaju.
Objašnjivost – motor rangiranja zapisuje koeficijente sličnosti i lanac prompta, omogućujući revizorima da prate zašto je određena datoteka odabrana.
Usuglašenost s propisima – prilažu se SPDX licence i GDPR procesorske kategorije svakom artefaktu, zadovoljavajući zahtjeve za dokazivanje podrijetla kod ISO 27001 Aneksa A.
Politike zadržavanja – zadaci za automatsko brisanje čiste embediranje za dokumente starije od definiranog perioda čuvanja podataka, osiguravajući da zastarjeli dokazi ne ostanu.

6. Smjerovi budućnosti

6.1 Dohvaćanje višemedija kao usluga (RaaS)

Izloženje orkestratora dohvaćanja preko GraphQL API‑ja omogućuje drugim internim alatima (npr. CI/CD provjere usklađenosti) da zahtijevaju dokaze bez prolaska kroz cijeli UI upitnika.

6.2 Integracija real‑time revizijskog radara

Kombiniranje motora s Revizijskim radarem Procurizea. Kad se otkrije nova regulativa, automatski se re‑klasificiraju pogođena pitanja i pokreće svježi pretraživač dokaza, jamčeći da priloženi artefakti ostaju usklađeni.

6.3 Federirano učenje među poduzećima

Za SaaS providere koji opsluživaju mnoge klijente, federirano učenje može dijeliti anonimizirane nadogradnje embediranja, poboljšavajući kvalitetu dohvaćanja bez otkrivanja vlasničkih dokumenata.

7. Zaključak

Sigurnosni upitnici ostat će temelj upravljanja rizikom kod dobavljača, ali ručni napor prikupljanja i prilaženja dokaza postaje sve neodrživiji. Korištenjem višemedijskog AI‑a — spoja razumijevanja teksta, slika i koda — Procurize može pretvoriti izdvajanje dokaza u automatiziranu, revizijsku uslugu. Primjena Generative Engine Optimization osigurava da sustav neprestano napreduje, usklađujući AI‑pouzdanje s očekivanjima ljudskih recenzenata i regulatornim zahtjevima.

Rezultat je drastično ubrzavanje odgovora na upitnike, smanjenje ljudskih pogrešaka i snažniji revizijski trag — sve to osnažuje timove za sigurnost, pravnu usklađenost i prodaju da se fokusiraju na strateško upravljanje rizikom, a ne na zamorne pretrage dokumenata.