Извлечение доказательств с помощью мульти‑модального ИИ для вопросов безопасности

Вопросники по безопасности — это ворота каждой сделки B2B SaaS. Поставщикам просят предоставить доказательства — политики в PDF, схемы архитектуры, фрагменты кода, журналы аудита и даже скриншоты дашбордов. Традиционно команды по безопасности и соответствию тратят часы, просеивая репозитории, копируя файлы и вручную прикрепляя их к полям вопросника. Результат — узкое место, которое замедляет цикл продаж, увеличивает число ошибок человека и создает пробелы в аудитах.

Procurize уже построила мощную единую платформу для управления вопросниками, распределения задач и генерации ответов с поддержкой ИИ. Следующий рубеж — автоматизировать сам сбор доказательств. Используя мульти‑модальный генеративный ИИ — модели, понимающие текст, изображения, таблицы и код в едином конвейере — организации могут мгновенно находить нужный артефакт для любого пункта вопросника, независимо от формата.

В этой статье мы:

Объясним, почему подход, основанный на одной модальности (только текстовые LLM), не справляется с современными задачами соответствия.
Подробно опишем архитектуру мульти‑модального движка извлечения доказательств, построенного на основе Procurize.
Показуем, как обучать, оценивать и постоянно улучшать систему с помощью техник Generative Engine Optimization (GEO).
Предоставим конкретный сквозной пример — от вопроса до автоматически прикреплённого доказательства.
Обсудим вопросы управления, безопасности и аудируемости.

Ключевой вывод: Мульти‑модальный ИИ трансформирует извлечение доказательств из ручной работы в повторяемый, аудируемый сервис, сокращая время отклика на вопросник до 80 % при сохранении строгой соответствия.

1. Ограничения текстовых LLM в рабочих процессах вопросников

Большинство современных автоматизаций, основанных на ИИ, используют крупные языковые модели (LLM), которые преуспевают в генерации текста и семантическом поиске. Они умеют вытаскивать пункты политик, суммировать отчёты аудита и даже черкать повествовательные ответы. Однако доказательства соответствия редко бывают чистым текстом:

Тип доказательства	Обычный формат	Трудности для чисто текстовой LLM
Схемы архитектуры	PNG, SVG, Visio	Требуется визуальное восприятие
Файлы конфигураций	YAML, JSON, Terraform	Структурировано, но часто глубоко вложено
Фрагменты кода	Java, Python, Bash	Необходима синтаксически‑aware извлечение
Скриншоты дашбордов	JPEG, PNG	Нужно читать UI‑элементы, метки времени
Таблицы в PDF‑отчётах аудита	PDF, отсканированные изображения	OCR + разбор таблиц

Когда вопрос звучит так: «Предоставьте схему сети, иллюстрирующую поток данных между вашими продакшн‑ и резервными окружениями», модель, работающая только с текстом, может ответить лишь описанием; она не способна найти, проверить или встроить нужное изображение. Этот пробел заставляет пользователей вмешиваться, вновь вводя ручной труд, который мы стремимся устранить.

2. Архитектура мульти‑модального движка извлечения доказательств

Ниже — схематическое diagram предложенного движка, интегрированного с ядром вопросника Procurize.

  graph TD
    A["Пользователь отправляет элемент анкеты"] --> B["Служба классификации вопроса"]
    B --> C["Оркестратор мульти‑модального поиска"]
    C --> D["Текстовое векторное хранилище (FAISS)"]
    C --> E["Хранилище эмбеддингов изображений (CLIP)"]
    C --> F["Хранилище эмбеддингов кода (CodeBERT)"]
    D --> G["Семантическое совпадение (LLM)"]
    E --> G
    F --> G
    G --> H["Движок ранжирования доказательств"]
    H --> I["Обогащение метаданными соответствия"]
    I --> J["Автоприкрепление к задаче Procurize"]
    J --> K["Проверка человеком (HITL)"]
    K --> L["Запись в аудит‑лог"]

2.1 Основные компоненты

Служба классификации вопроса — использует дообученную LLM для маркировки входящих пунктов вопросника типами требуемых доказательств (например, «сетевой diagram», «PDF‑политика», «Terraform‑plan»).
Оркестратор мульти‑модального поиска — направляет запрос в соответствующее векторное хранилище в зависимости от классификации.
Эмбеддинг‑хранилища
- Текстовое хранилище — FAISS‑индекс, построенный из всех политических документов, аудиторских отчётов и markdown‑файлов.
- Хранилище изображений — эмбеддинги CLIP, сгенерированные из каждой схемы, скриншота и SVG, хранящихся в репозитории документов.
- Хранилище кода — эмбеддинги CodeBERT для всех исходных файлов, конфигураций CI/CD и IaC‑шаблонов.
Слой семантического совпадения — кросс‑модальный трансформер объединяет эмбеддинг запроса со всеми векторами модальностей, возвращая упорядоченный список кандидатов.
Движок ранжирования доказательств — применяет GEO‑гипотезы: актуальность, статус в системе контроля версий, релевантность тегов соответствия и оценка уверенности LLM.
Обогащение метаданными соответствия — добавляет SPDX‑лицензии, временные метки аудита и категории обработки данных к каждому артефакту.
Проверка человеком (HITL) — UI в Procurize показывает топ‑3 предложения; рецензент может утвердить, заменить или отклонить.
Запись в аудит‑лог — каждое автоприкрепление фиксируется с криптографическим хэшем, подписью рецензента и уровнем уверенности ИИ, удовлетворяя требования SOX и GDPR.

2.2 Конвейер ingest‑данных

Краулер сканирует корпоративные файловые хранилища, Git‑репозитории и облачные бакеты.
Препроцессор запускает OCR по отсканированным PDF (Tesseract), извлекает таблицы (Camelot) и конвертирует файлы Visio в SVG.
Эмбеддер генерирует модально‑специфичные векторы и сохраняет их с метаданными (путь файла, версия, владелец).
Инкрементальное обновление — микросервис‑watchdog пере‑эмбеддит только изменённые активы, поддерживая векторные хранилища актуальными в режиме почти‑реального времени.

3. Generative Engine Optimization (GEO) для извлечения доказательств

GEO — систематический метод настройки всей AI‑цепочки, а не только языковой модели, чтобы улучшить конечный KPI (время отклика на вопросник), сохраняя качество соответствия.

Фаза GEO	Цель	Ключевые метрики
Качество данных	Обеспечить, чтобы эмбеддинги отражали актуальную позицию по соответствию	% активов, обновлённые < 24 ч
Промпт‑инжиниринг	Сформировать запросы, направляющие модель к нужной модальности	Оценка уверенности поиска
Калибровка модели	Выравнивание порогов уверенности с уровнями приемки человеком	Уровень ложноположительных < 5 %
Обратная связь	Собирать действия рецензентов для дообучения классификации и ранжирования	Среднее время утверждения (MTTA)
Непрерывная оценка	Ночью проводить A/B‑тесты на наборе исторических вопросов	Сокращение среднего времени ответа

3.1 Пример промпта для мульти‑модального поиска

[QUESTION] Предоставьте последний отчёт SOC 2 Type II, охватывающий шифрование данных в покое.

[CONTEXT] Найдите PDF‑документ, содержащий соответствующий раздел аудита. Верните ID документа, диапазон страниц и краткий отрывок.

[MODALITY] text

Оркестратор разбирает тег [MODALITY] и запрашивает только текстовое хранилище, существенно уменьшая шум от изображений и кода.

3.2 Адаптивные пороги

С помощью байесовской оптимизации система автоматически регулирует пороги уверенности для каждой модальности. Когда рецензенты постоянно принимают предложения выше 0,78 уверенности для схем, порог повышается, уменьшая количество лишних проверок. Если же фрагменты кода часто отклоняются, порог снижается, что приводит к большему количеству кандидатов.

4. Сквозной пример: от вопроса до автоприкреплённого доказательства

4.1 Вопрос

«Прикрепите схему, показывающую поток клиентских данных от их поступления до хранения, включая точки шифрования.»

4.2 Пошаговый процесс

Шаг	Действие	Результат
1	Пользователь создаёт новый пункт вопросника в Procurize.	ID элемента `Q‑2025‑1123`.
2	Служба классификации помечает запрос как `evidence_type: network diagram`.	Модальность = image.
3	Оркестратор посылает запрос в хранилище изображений CLIP.	Получено 12 кандидатных векторов.
4	Слой семантического совпадения считает косинусную схожесть между эмбеддингом запроса и каждым вектором.	Топ‑3 оценки: 0,92; 0,88; 0,85.
5	Движок ранжирования учитывает актуальность (модифицировано 2 дн. назад) и теги соответствия (содержит “encryption”).	Итоговый топ: диаграмма `arch‑data‑flow‑v3.svg`.
6	UI HITL показывает диаграмму с превью, метаданными (автор, версия, хэш).	Рецензент нажимает Approve.
7	Система автоматически прикрепляет диаграмму к `Q‑2025‑1123` и записывает аудит‑лог.	В журнале записаны уверенность ИИ = 0,91, подпись рецензента, временная метка.
8	Модуль генерации ответа чертит текстовое повествование, ссылаясь на диаграмму.	Готовый ответ готов к экспорту.

Общее время от шага 1 до шага 8 ≈ 45 секунд, против обычных 15–20 минут ручного поиска.

5. Управление, безопасность и аудит

Автоматизация работы с доказательствами поднимает важные вопросы:

Утечка данных — сервисы эмбеддингов должны работать в VPC с нулевым доверием и строгими IAM‑ролями. Никакие эмбеддинги не покидают корпоративную сеть.
Контроль версий — каждый артефакт хранится с Git‑хешем (или версией объекта в хранилище). При обновлении документа старые эмбеддинги инвалидируются.
Объяснимость — движок ранжирования логирует оценки схожести и цепочку промптов, позволяя специалистам по соответствию увидеть, почему был выбран конкретный файл.
Соответствие регуляциям — прикрепляя SPDX‑идентификаторы лицензий и категории обработки GDPR к каждому артефакту, решение удовлетворяет требованиям ISO 27001 Annex A.
Политика хранения — задачи авточистки удаляют эмбеддинги документов старше установленного окна хранения, гарантируя, что устаревшие доказательства не остаются в системе.

6. Перспективы развития

6.1 Мульти‑модальный поиск как сервис (RaaS)

Экспортировать оркестратор через GraphQL API, чтобы другие внутренние инструменты (например, проверки соответствия в CI/CD) могли запрашивать доказательства без прохождения полного UI вопросника.

6.2 Интеграция с системой мониторинга регулятивных изменений

Комбинировать мульти‑модальный движок с Radar — Regulatory Change от Procurize. При появлении нового регламента автоматически пере‑классифицировать затронутые вопросы и инициировать свежий поиск доказательств, гарантируя актуальность загруженных артефактов.

6.3 Федерированное обучение между предприятиями

Для SaaS‑провайдеров, обслуживающих несколько клиентов, можно построить федерированную обучающую слой, которая делится анонимизированными обновлениями эмбеддингов, повышая качество поиска без раскрытия конфиденциальных документов.

7. Заключение

Вопросники по безопасности останутся краеугольным камнем управления рисками поставщиков, но ручной труд по поиску и прикреплению доказательств становится всё менее приемлемым. Применяя мульти‑модальный ИИ — комбинацию понимания текста, изображений и кода — Procurize способна превратить извлечение доказательств в автоматизированный, auditable сервис. Техники Generative Engine Optimization гарантируют, что система будет постоянно улучшать свои результаты, выравнивая уверенность ИИ с ожиданиями человеческих рецензентов и требованиями регуляторов.

Итог: заметное ускорение ответов на вопросники, снижение числа ошибок человека и укрепление аудиторского следа — всё это даёт командам безопасности, юридическим отделам и отделам продаж возможность сосредоточиться на стратегическом управлении рисками, а не на рутинном поиске документов.