Extrahování důkazů pomocí multimodální AI pro bezpečnostní dotazníky

Bezpečnostní dotazníky jsou vstupní branou každého B2B SaaS obchodu. Dodavatelé jsou požádáni o předložení důkazů — politiky v PDF, architektonické diagramy, úryvky kódu, auditní logy a dokonce i snímky obrazovky dashboardů. Tradičně týmy pro bezpečnost a soulad stráví hodiny procházením repozitářů, kopírováním souborů a ručním přikládáním k polím dotazníku. Výsledkem je úzké hrdlo, které zpomaluje prodejní cykly, zvyšuje lidské chyby a vytváří mezery v auditu.

Procurize již postavil výkonnou sjednocenou platformu pro správu dotazníků, přiřazování úkolů a AI‑asistovanou tvorbu odpovědí. Další hranice je automatizovat samotný sběr důkazů. Využitím multimodální generativní AI — modelů, které rozumí textu, obrázkům, tabulkám i kódu v jedné pipeline — organizace mohou okamžitě najít správný artefakt pro jakoukoli položku dotazníku, nezávisle na formátu.

V tomto článku se podíváme:

Vysvětlíme, proč přístup založený na jedné modalitě (čisté textové LLM) nestačí pro moderní pracovní zatížení související se souladem.
Popíšeme architekturu motoru pro multimodální extrakci důkazů postaveného na platformě Procurize.
Ukážeme, jak trénovat, hodnotit a neustále zlepšovat systém pomocí technik Generative Engine Optimization (GEO).
Poskytneme konkrétní end‑to‑end příklad, od bezpečnostní otázky po automaticky připojený důkaz.
Probereme otázky správy, bezpečnosti a auditovatelnosti.

Klíčový výsledek: Multimodální AI promění získávání důkazů z manuální práce na opakovatelnou, auditovatelnou službu, která zkrátí dobu vyřízení dotazníku až o 80 % při zachování přísného souladu.

1. Limity textových LLM v pracovních postupech dotazníků

Většina dnešní AI‑driven automatizace se opírá o velké jazykové modely (LLM), které excelují v generování textu a sémantickém vyhledávání. Dokážou vytáhnout klauzule politik, shrnout auditní zprávy a dokonce navrhnout narativní odpovědi. Nicméně důkazy pro soulad jsou jen zřídka čistě textové:

Typ důkazu	Typický formát	Problém pro čistě textový LLM
Architektonické diagramy	PNG, SVG, Visio	Vyžaduje vizuální porozumění
Konfigurační soubory	YAML, JSON, Terraform	Strukturované, ale často zanořené
Úryvky kódu	Java, Python, Bash	Vyžadují syntaktické rozpoznání
Snímky dashboardů	JPEG, PNG	Musí přečíst UI elementy, časová razítka
Tabulky v PDF auditních zpráv	PDF, skenované obrazy	OCR + parsování tabulek nutné

Když se otázka zeptá „Poskytněte síťový diagram, který ilustruje tok dat mezi vaším produkčním a záložním prostředím“, model zaměřený jen na text může odpovědět pouze popisem; nemůže najít, ověřit ani vložit skutečný obrázek. Tento nedostatek nutí uživatele zasahovat ručně, čímž se vrací zpět manuální úsilí, které se snažíme eliminovat.

2. Architektura motoru pro multimodální extrakci důkazů

Níže je schéma vysoké úrovně navrhovaného motoru, integrováného s jádrem dotazníkového hubu v Procurize.

  graph TD
    A["Uživatel odešle položku dotazníku"] --> B["Služba klasifikace otázek"]
    B --> C["Orchestrátor multimodálního získávání"]
    C --> D["Textový vektorový obchod (FAISS)"]
    C --> E["Obrázkový embedding obchod (CLIP)"]
    C --> F["Kódový embedding obchod (CodeBERT)"]
    D --> G["Sémantické porovnání (LLM)"]
    E --> G
    F --> G
    G --> H["Engine pro řazení důkazů"]
    H --> I["Obohacení o metadata souhlasu"]
    I --> J["Automatické připojení k úkolu v Procurize"]
    J --> K["Lidské ověření v režimu HITL"]
    K --> L["Záznam auditu"]

2.1 Hlavní komponenty

Služba klasifikace otázek – Používá jemně doladěný LLM k označení příchozích položek dotazníku typy důkazů (např. „síťový diagram“, „PDF politika“, „Terraform plán“).
Orchestrátor multimodálního získávání – Na základě klasifikace směruje požadavek do odpovídajících embeddingových obchodů.
Embeddingové obchody
- Textový obchod – FAISS index vytvořený ze všech politických dokumentů, auditních zpráv a markdown souborů.
- Obrázkový obchod – Vektory založené na CLIP vygenerované ze všech diagramů, screenshotů a SVG v úložišti dokumentů.
- Kódový obchod – CodeBERT embeddingy pro všechny zdrojové soubory, CI/CD konfigurace a IaC šablony.
Sémantická vrstva porovnání – Křížový transformer spojuje embedding dotazu se vektory všech modalit a vrací seřazený seznam kandidátů artefaktů.
Engine pro řazení důkazů – Aplikuje heuristiky Generative Engine Optimization: čerstvost, stav ve verzovacím systému, relevance souladových tagů a skóre důvěry modelu.
Obohacení o metadata souhlasu – Připojuje SPDX licence, auditní časové razítka a kategorie zpracování dle GDPR k každému artefaktu.
Lidské ověření v režimu HITL – UI v Procurize zobrazí 3 nejlepší návrhy; reviewer může schválit, nahradit nebo odmítnout.
Záznam auditu – Každé automatické připojení je zaznamenáno s kryptografickým hashem, podpisem revieweru a AI důvěry, což splňuje požadavky SOX a GDPR.

2.2 Pipeline pro ingestování dat

Crawler prohledá firemní sdílené disky, Git repozitáře a cloudová úložiště.
Pre‑procesor spustí OCR na naskenovaných PDF (Tesseract), extrahuje tabulky (Camelot) a převádí Visio soubory na SVG.
Embedder vytvoří vektory pro každou modalitu a uloží je s metadaty (cesta, verze, vlastník).
Inkrementální aktualizace – mikroservis „watchdog“ detekuje změny a překóduje jen modifikované artefakty, čímž udržuje embeddingové obchody čerstvé v reálném čase.

3. Generative Engine Optimization (GEO) pro získávání důkazů

GEO je systematická metoda ladit celý AI řetězec — nejen jazykový model — tak, aby se zlepšilo konečné KPI (doba vyřízení dotazníku) a zároveň se zachovala kvalita souhlasu.

Fáze GEO	Cíl	Klíčové metriky
Kvalita dat	Zajistit, aby embeddingy odrážely aktuální stav souhlasu	% artefaktů obnovených < 24 h
Inženýring promptů	Vytvořit dotazy, které nasměrují model k správné modalitě	Skóre důvěry při získávání
Kalibrace modelu	Slaďovat důvěru modelu s mírou přijetí reviewerů	Míra false‑positive < 5 %
Zpětná smyčka	Zachytávat akce reviewerů pro doladění klasifikace a řazení	Průměrná doba schválení (MTTA)
Kontinuální hodnocení	Noční A/B testy na validační sadě historických otázek	Snížení průměrné doby odpovědi

3.1 Příklad promptu pro multimodální získávání

[DOTAZ] Poskytněte nejnovější auditní zprávu SOC 2 Type II, která zahrnuje šifrování dat v klidu.

[KONTEXT] Vyhledejte PDF dokument, který obsahuje relevantní sekci auditu. Vraťte ID dokumentu, rozsah stránek a krátký výpis.

[MODALITA] text

Orchestrátor rozpozná štítek [MODALITA] a dotázá se pouze na textový obchod, čímž se dramaticky sníží šum z obrázků či kódu.

3.2 Adaptivní prahové hodnoty

Pomocí Bayesian Optimization systém automaticky upravuje prahovou hodnotu důvěry pro každou modalitu. Když reviewerové konzistentně schvalují návrhy nad 0,78 důvěry pro diagramy, práh se zvýší a sníží nevyžádané zásahy. Naopak, pokud úryvky kódu dostávají mnoho odmítnutí, práh se sníží, aby se zobrazilo více kandidátních artefaktů.

4. End‑to‑End příklad: Od otázky po automaticky připojený důkaz

4.1 Otázka

„Připojte diagram, který ukazuje tok zákaznických dat od ingestu po úložiště, včetně bodů šifrování.“

4.2 Krok‑za‑krokem průběh

Krok	Akce	Výsledek
1	Uživatel vytvoří novou položku dotazníku v Procurize.	ID položky `Q‑2025‑1123`.
2	Služba klasifikace označí dotaz jako `evidence_type: network diagram`.	Modalita = obrázek.
3	Orchestrátor pošle dotaz do CLIP obrazového obchodu.	Získá 12 kandidátních vektorů.
4	Sémantické porovnání vypočítá kosinovou podobnost mezi dotazem a vektory.	Top‑3 skóre: 0,92; 0,88; 0,85.
5	Engine pro řazení vyhodnotí čerstvost (upraveno před 2 dny) a tagy souhlasu (obsahuje „encryption“).	Finální výběr: diagram `arch‑data‑flow‑v3.svg`.
6	UI HITL zobrazí diagram s náhledem, metadaty (autor, verze, hash).	Reviewer klikne Schválit.
7	Systém automaticky připojí diagram k `Q‑2025‑1123` a zaznamená auditní záznam.	Audit log ukazuje AI důvěru 0,91, podpis revieweru, časové razítko.
8	Modul generování odpovědí vytvoří narativní text odkazující na diagram.	Kompletní odpověď připravena k exportu.

Celková doba od kroku 1 do kroku 8 je ≈ 45 sekund, oproti typickým 15–20 minutám při ručním vyhledávání.

5. Správa, bezpečnost a auditovatelná stopa

Automatizace získávání důkazů přináší legitimní otázky:

Únik dat – Embeddingové služby musí běžet v Zero‑Trust VPC s přísnými IAM rolemi. Žádné embeddingy neopouštějí firemní síť.
Kontrola verzí – Každý artefakt je uložen s Git commit hashem (nebo verzí objektu úložiště). Při aktualizaci dokumentu se staré embeddingy neplatněny.
Vysvětlitelnost – Engine pro řazení loguje podobnostní skóre a celý řetězec promptů, což umožňuje compliance officerům sledovat proč byl konkrétní soubor vybrán.
Soulad s regulacemi – Připojením SPDX licenčních identifikátorů a GDPR kategorií zpracování ke každému artefaktu splňujeme požadavky na původ důkazů pro ISO 27001 Annex A.
Politiky retenčních – Automatické úlohy purge odstraňují embeddingy pro dokumenty starší než stanovená retenční doba organizace, čímž se předchází uchovávání zastaralých důkazů.

6. Budoucí směřování

6.1 Multimodální získávání jako služba (RaaS)

Exponovat orchestrátor přes GraphQL API, aby jiné interní nástroje (např. compliance kontroly v CI/CD) mohly požadovat důkazy bez nutnosti projít kompletním UI dotazníku.

6.2 Integrace s reálným časem regulační radar

Propojit motor s Regulatory Change Radar v Procurize. Při detekci nové regulace automaticky pře‑klasifikovat dotazy a spustit nový vyhledávací proces, čímž se zajistí, že připojené artefakty zůstávají v souladu.

6.3 Federované učení napříč organizacemi

U poskytovatelů SaaS, kteří obsluhují více zákazníků, lze nasadit federované učení, které sdílí anonymizované aktualizace embeddingů a zlepšuje kvalitu vyhledávání, aniž by unikaly proprietární dokumenty.

7. Závěr

Bezpečnostní dotazníky zůstanou klíčovým pilířem řízení rizik dodavatelů, ale manuální úsilí spojené se sběrem a přikládáním důkazů se rychle stává neudržitelným. Přijetím multimodální AI — kombinace textu, obrázků a kódu — může Procurize převést extrakci důkazů na automatizovanou, auditovatelnou službu. Aplikace Generative Engine Optimization zajišťuje, že se systém neustále zdokonaluje a sladí AI důvěru s očekáváními lidských reviewerů a požadavky regulací.

Výsledkem je dramatické zrychlení odezvy na dotazníky, snížení lidských chyb a silnější auditní stopa, což umožňuje týmům bezpečnosti, právnímu oddělení i prodeji soustředit se na strategické řízení rizik místo na opakující se hledání dokumentů.