Extraction d’Évidence par IA Multi‑Modale pour les Questionnaires de Sécurité

Les questionnaires de sécurité sont les gardiens de chaque transaction SaaS B2B. On demande aux fournisseurs de fournir des preuves — PDF de politiques, diagrammes d’architecture, extraits de code, journaux d’audit, voire captures d’écran de tableaux de bord. Traditionnellement, les équipes de sécurité et de conformité passent des heures à parcourir les dépôts, copier les fichiers et les joindre manuellement aux champs du questionnaire. Le résultat est un goulot d’étranglement qui ralentit les cycles de vente, augmente les erreurs humaines et crée des lacunes d’audit.

Procurize a déjà construit une plateforme unifiée puissante pour la gestion des questionnaires, l’attribution de tâches et la génération de réponses assistée par IA. La prochaine frontière est d’automatiser la collecte même des preuves. En exploitant l’IA générative multi‑modale—des modèles qui comprennent texte, images, tableaux et code dans un même pipeline—les organisations peuvent instantanément mettre en avant le bon artefact pour n’importe quel élément du questionnaire, quel que soit le format.

Dans cet article, nous allons :

Expliquer pourquoi une approche mono‑modalité (LLM texte pur) est insuffisante pour les charges de travail de conformité modernes.
Détailler l’architecture d’un moteur d’extraction d’évidence multi‑modale construit sur Procurize.
Montrer comment entraîner, évaluer et améliorer continuellement le système avec les techniques d’Optimisation du Moteur Génératif (GEO).
Fournir un exemple concret de bout en bout, du questionnaire à la preuve auto‑attachée.
Discuter des enjeux de gouvernance, de sécurité et de traçabilité d’audit.

Conclusion clé : L’IA multi‑modale transforme la récupération d’évidence d’une tâche manuelle en un service répétable et auditable, réduisant le temps de réponse aux questionnaires jusqu’à 80 % tout en préservant la rigueur de la conformité.

1. Les limites des LLMs uniquement texte dans les flux de travail des questionnaires

La plupart des automatisations basées sur l’IA aujourd’hui s’appuient sur de grands modèles de langage (LLM) qui excellent dans la génération de texte et la recherche sémantique. Ils peuvent extraire des clauses de politiques, résumer des rapports d’audit et même rédiger des réponses narratives. Cependant, les preuves de conformité sont rarement du texte pur :

Type de preuve	Format typique	Difficulté pour un LLM uniquement texte
Diagrammes d’architecture	PNG, SVG, Visio	Nécessite une compréhension visuelle
Fichiers de configuration	YAML, JSON, Terraform	Structurés mais souvent imbriqués
Extraits de code	Java, Python, Bash	Extraction sensible à la syntaxe
Captures d’écran de tableaux de bord	JPEG, PNG	Lecture des éléments UI, horodatage
Tableaux dans les rapports PDF d’audit	PDF, images scannées	OCR + parsing de tableau requis

Lorsque une question demande « Fournissez un diagramme réseau illustrant le flux de données entre vos environnements de production et de sauvegarde », un modèle texte‑only ne peut répondre que par une description ; il ne peut pas localiser, vérifier ou intégrer l’image réelle. Cette lacune oblige les utilisateurs à intervenir, réintroduisant l’effort manuel que nous cherchons à éliminer.

2. Architecture d’un moteur d’extraction d’évidence multi‑modale

Voici un diagramme de haut niveau du moteur proposé, intégré au cœur du hub de questionnaires de Procurize.

  graph TD
    A["L'utilisateur soumet un élément de questionnaire"] --> B["Service de classification des questions"]
    B --> C["Orchestrateur de récupération multi‑modale"]
    C --> D["Magasin de vecteurs texte (FAISS)"]
    C --> E["Magasin d'embeddings d'images (CLIP)"]
    C --> F["Magasin d'embeddings de code (CodeBERT)"]
    D --> G["Correspondance sémantique (LLM)"]
    E --> G
    F --> G
    G --> H["Moteur de classement des preuves"]
    H --> I["Enrichissement des métadonnées de conformité"]
    I --> J["Auto‑attachement à la tâche Procurize"]
    J --> K["Vérification humaine (HITL)"]
    K --> L["Entrée du journal d’audit"]

2.1 Composants principaux

Service de classification des questions – Utilise un LLM finement ajusté pour étiqueter les éléments du questionnaire avec les types de preuve (ex. : « diagramme réseau », « PDF de politique de sécurité », « plan Terraform »).
Orchestrateur de récupération multi‑modale – Dirige la requête vers les magasins d’embeddings appropriés en fonction de la classification.
Magasins d’embeddings
- Magasin texte – Index FAISS construit à partir de tous les documents de politique, rapports d’audit et fichiers markdown.
- Magasin d’images – Vecteurs basés sur CLIP générés pour chaque diagramme, capture d’écran et SVG stocké dans le dépôt de documents.
- Magasin de code – Embeddings CodeBERT pour tous les fichiers source, configurations CI/CD et modèles IaC.
Couche de correspondance sémantique – Un transformeur cross‑modal fusionne l’embedding de la requête avec les vecteurs de chaque modalité, renvoyant une liste classée d’artifacts candidats.
Moteur de classement des preuves – Applique les heuristiques de GEO : fraîcheur, statut de contrôle de version, pertinence des tags de conformité et score de confiance du LLM.
Enrichissement des métadonnées de conformité – Ajoute les licences SPDX, horodatages d’audit et catégories de protection des données à chaque artefact.
Vérification humaine (HITL) – L’interface de Procurize montre les 3 meilleures suggestions ; un réviseur peut approuver, remplacer ou rejeter.
Entrée du journal d’audit – Chaque auto‑attachement est enregistré avec le hash cryptographique, la signature du réviseur et la confiance IA, satisfaisant les exigences de SOX et du RGPD.

2.2 Pipeline d’ingestion des données

Crawler parcourt les partages de fichiers d’entreprise, dépôts Git, seaux cloud.
Pré‑processeur exécute OCR sur les PDF scannés (Tesseract), extrait les tableaux (Camelot) et convertit les fichiers Visio en SVG.
Embedder génère les vecteurs spécifiques à chaque modalité et les stocke avec métadonnées (chemin, version, propriétaire).
Mise à jour incrémentielle – Un micro‑service de détection de changements (watchdog) ré‑embarque uniquement les actifs modifiés, maintenant les stores à jour en quasi temps réel.

3. Optimisation du Moteur Génératif (GEO) pour la récupération d’évidence

GEO est une méthode systématique pour régler l’ensemble du pipeline IA — et pas seulement le modèle de langue—afin d’améliorer le KPI final (temps de traitement du questionnaire) tout en maintenant la qualité de conformité.

Phase GEO	Objectif	Métriques clés
Qualité des données	Garantir que les embeddings reflètent l’état de conformité le plus récent	% d’actifs rafraîchis < 24 h
Ingénierie des prompts	Concevoir des prompts de récupération qui orientent le modèle vers la bonne modalité	Score de confiance de récupération
Calibration du modèle	Aligner les seuils de confiance avec les taux d’acceptation des réviseurs humains	Taux de faux‑positifs < 5 %
Boucle de rétroaction	Capturer les actions des réviseurs pour affiner la classification et le classement	Temps moyen d’approbation (MTTA)
Évaluation continue	Exécuter des tests A/B nocturnes sur un jeu de validation d’historique de questionnaires	Réduction du temps moyen de réponse

3.1 Exemple de prompt pour la récupération multi‑modale

[QUESTION] Fournissez le rapport d’audit SOC 2 Type II le plus récent couvrant le chiffrement des données au repos.

[CONTEXT] Récupérez un document PDF contenant la section d’audit pertinente. Retournez l’ID du document, la plage de pages et un bref extrait.

[MODALITY] texte

L’orchestrateur analyse la balise [MODALITY] et interroge uniquement le magasin texte, réduisant considérablement le bruit provenant des vecteurs d’images ou de code.

3.2 Seuils adaptatifs

Grâce à une optimisation bayésienne, le système ajuste automatiquement le seuil de confiance pour chaque modalité. Lorsque les réviseurs acceptent régulièrement les suggestions au-dessus de 0,78 de confiance pour les diagrammes, le seuil augmente, diminuant le nombre d’interventions humaines. À l’inverse, si les extraits de code sont souvent rejetés, le seuil baisse, générant davantage de candidats.

4. Exemple de bout en bout : du questionnaire à la preuve auto‑attachée

4.1 La question

« Veuillez joindre un diagramme illustrant le flux des données client depuis l’ingestion jusqu’au stockage, en incluant les points de chiffrement. »

4.2 Déroulement étape par étape

Étape	Action	Résultat
1	L’utilisateur crée un nouvel élément de questionnaire dans Procurize.	Identifiant d’élément `Q‑2025‑1123`.
2	Le service de classification indique le type de preuve : `evidence_type: diagramme réseau`.	Modalité = image.
3	L’orchestrateur interroge le magasin d’embeddings CLIP.	Récupère 12 vecteurs candidats.
4	La couche de correspondance sémantique calcule la similarité cosinus entre l’embedding de la requête et chaque vecteur.	Top‑3 scores : 0,92 ; 0,88 ; 0,85.
5	Le moteur de classement évalue la fraîcheur (modifié il y a 2 jours) et les tags de conformité (contient « chiffrement »).	Classement final : diagramme `arch‑data‑flow‑v3.svg`.
6	L’interface HITL affiche le diagramme avec aperçu, métadonnées (auteur, version, hash).	Le réviseur clique Approuver.
7	Le système auto‑attache le diagramme à `Q‑2025‑1123` et enregistre une entrée d’audit.	Journal d’audit : confiance IA 0,91, signature réviseur, horodatage.
8	Le module de génération de réponse rédige une narration faisant référence au diagramme.	Réponse complète prête à l’export.

Le temps total écoulé entre l’étape 1 et l’étape 8 est ≈ 45 secondes, contre les 15‑20 minutes généralement requises pour une recherche manuelle.

5. Gouvernance, sécurité et traçabilité d’audit

L’automatisation de la gestion des preuves soulève des préoccupations légitimes :

Fuite de données – Les services d’embedding doivent fonctionner dans un VPC zéro‑trust avec des rôles IAM stricts. Aucun embedding ne quitte le réseau d’entreprise.
Contrôle de version – Chaque artefact est stocké avec son hash de commit Git (ou version d’objet de stockage). Lorsqu’un document est mis à jour, les anciens embeddings sont invalidés.
Explicabilité – Le moteur de classement consigne les scores de similarité et la chaîne de prompts, permettant aux responsables conformité de tracer pourquoi un fichier donné a été sélectionné.
Conformité réglementaire – En attachant les identifiants de licence SPDX et les catégories de traitement GDPR à chaque artefact, la solution satisfait aux exigences de traçabilité d’origine de preuves pour ISO 27001 Annex A.
Politiques de rétention – Des jobs d’auto‑purge nettoient les embeddings de documents dépassant la fenêtre de rétention de l’entreprise, garantissant qu’aucune preuve obsolète ne persiste.

6. Perspectives futures

6.1 Récupération multi‑modale en tant que service (RaaS)

Exposer l’orchestrateur via une API GraphQL afin que d’autres outils internes (ex. : contrôles de conformité CI/CD) puissent demander des preuves sans passer par l’interface complète du questionnaire.

6.2 Intégration en temps réel du Radar de changement réglementaire

Combiner le moteur multi‑modale avec le Radar de changement réglementaire de Procurize. Lorsqu’une nouvelle réglementation est détectée, re‑classer automatiquement les questions concernées et déclencher une nouvelle recherche de preuve, garantissant que les artefacts téléchargés restent conformes.

6.3 Apprentissage fédéré entre entreprises

Pour les fournisseurs SaaS servant plusieurs clients, une couche d’apprentissage fédéré peut partager des mises à jour d’embeddings anonymisées, améliorant la qualité de récupération sans exposer les documents propriétaires.

7. Conclusion

Les questionnaires de sécurité resteront une pierre angulaire de la gestion des risques fournisseurs, mais l’effort manuel de collecte et de jointure des preuves devient rapidement insoutenable. En adoptant l’IA multi‑modale — une combinaison de compréhension texte, image et code — Procurize peut transformer l’extraction d’évidence en un service automatisé, auditable et fiable. Grâce à l’Optimisation du Moteur Génératif, le système s’améliore en continu, alignant la confiance IA avec les attentes humaines et les exigences réglementaires.

Le résultat : une accélération spectaculaire du délai de réponse aux questionnaires, une réduction des erreurs humaines et une traçabilité d’audit renforcée, libérant les équipes de sécurité, juridique et commerciales pour se concentrer sur la mitigation stratégique des risques plutôt que sur la recherche fastidieuse de documents.