Эта статья исследует новое внедрение обучения с подкреплением (RL) в платформу автоматизации вопросов Procurize. Рассматривая каждый шаблон вопросника как агента RL, который обучается на основе обратной связи, система автоматически регулирует формулировку вопросов, сопоставление доказательств и порядок приоритетов. В результате ускоряется процесс, повышается точность ответов и создаётся постоянно развивающаяся база знаний, соответствующая меняющимся нормативным требованиям.
В этой статье раскрывается новый механизм мета‑обучения Procurize, который постоянно совершенствует шаблоны вопросов. Используя адаптацию в few‑shot, сигналы подкрепления и живой граф знаний, платформа снижает задержку ответов, повышает согласованность ответов и поддерживает данные соответствия в актуальном состоянии с изменяющимися регулятивными требованиями.
