Как работает скоринг поставщиков на AI? Система оценки, взвешенная модель ранжирования и пороги отсечения для автоматизации тендеров.
VibeLab
Поделиться

Закупочная комиссия из пяти человек оценивает 30 заявок по 12 критериям. Это 1 800 экспертных оценок — и каждая подвержена усталости, настроению и когнитивным искажениям. Взвешенная скоринговая модель с AI-автоматизацией сводит субъективность к минимуму и сокращает цикл оценки с недель до часов. Разбираем архитектуру такой модели, методы нормализации, пороги отсечения и готовые конфигурации для разных категорий закупок.
По данным Минфина РФ, в 2023 году в рамках 44-ФЗ и 223-ФЗ проведено более 3,5 млн закупочных процедур. Средний конкурс с технически сложным предметом собирает от 8 до 25 заявок. Каждая заявка — это комплект документов на 50–200 страниц: техническое предложение, финансовые показатели, лицензии, референс-листы, SLA-обязательства.
Ручной разбор порождает три системные проблемы:
Субъективность. Два эксперта оценивают одно и то же техническое предложение и расходятся на 15–30%. Исследования в области decision science подтверждают: разброс экспертных оценок растёт с увеличением количества критериев и усталости оценщика.
Время. Полный цикл оценки конкурса с 15+ заявками занимает 2–4 недели. Это задерживает проект ещё до его старта.
Немасштабируемость. При росте объёма закупок нельзя линейно наращивать штат комиссии. А качество оценки при перегрузке падает нелинейно.
Автоматизация оценки тендерных заявок — не вопрос моды на AI. Это ответ на арифметику: при 20 заявках и 10 критериях ручная оценка генерирует 200 точек решения, каждая из которых — потенциальный источник ошибки или оспаривания.
Скоринговая модель закупок — это формализованная система преобразования разнородных характеристик поставщика в единый числовой балл, пригодный для ранжирования.
Архитектура строится в четыре шага:
Формула аддитивной модели:
S = Σ (wᵢ × nᵢ)
где S — итоговый скор, wᵢ — вес i-го критерия (сумма всех весов = 1), nᵢ — нормализованное значение i-го критерия.
Аддитивная модель (S = Σ wᵢ × nᵢ) допускает компенсацию: слабый показатель по одному критерию можно «перекрыть» сильным по другому. Мультипликативная (S = Π nᵢ^wᵢ) жёстче: провал по любому критерию резко снижает итоговый балл.
Для закупок с критическими требованиями безопасности (медицина, оборонка, инфраструктура) мультипликативная модель предпочтительнее — она не позволяет «спрятать» слабое место за счёт низкой цены.
На практике чаще применяют аддитивную модель с порогами отсечения — это даёт гибкость аддитивного подхода и жёсткость мультипликативного там, где она нужна.
Критерии скоринга группируются в четыре категории:
| Категория | Примеры критериев | Типичный диапазон весов |
|---|---|---|
| Ценовые | Цена контракта, TCO, условия оплаты | 20–40% |
| Технические | Соответствие ТЗ, предложенный стек, SLA | 25–40% |
| Квалификационные | Опыт аналогичных проектов, штат, сертификации | 15–25% |
| Репутационные | История исполнения контрактов, отзывы, судебные дела | 5–15% |
Распределение весов — это не универсальная формула, а отражение приоритетов конкретной закупки. Для IT-закупки с высокими требованиями к качеству технические критерии получают 35–40%, а ценовые — 20–25%. Для товарной закупки стандартизированной продукции пропорция обратная.
Ключевой принцип: сумма весов всегда равна 1 (или 100%). Это дисциплина приоритизации. Если вы добавляете новый критерий, вы обязаны «забрать» вес у существующих, а не раздувать модель.
Пороги отсечения работают как фильтр: поставщик, не прошедший порог, не участвует в ранжировании, независимо от остальных показателей.
Бинарные: есть/нет. Наличие лицензии, допуск СРО, минимальный годовой оборот, отсутствие в реестре недобросовестных поставщиков. Это обязательные условия допуска, проверяемые до скоринга.
Примеры для IT-закупки:
Минимально допустимое значение по отдельному критерию. Например: опыт аналогичных проектов — не менее 3, финансовая устойчивость (коэффициент текущей ликвидности) — не ниже 1,2. Поставщик с показателем ниже порога получает 0 баллов по критерию, но остаётся в ранжировании.
Комбинация жёстких и мягких порогов создаёт двухуровневую фильтрацию: сначала отсекаются заведомо непригодные участники, затем оставшиеся ранжируются с учётом штрафа за слабые показатели.
Ключевая техническая задача скоринга — привести разнородные показатели к единому диапазону. Цена измеряется в рублях, опыт — в количестве проектов, SLA — в процентах uptime. Без нормализации сравнение бессмысленно.
Самый распространённый метод:
nᵢ = (xᵢ - xₘᵢₙ) / (xₘₐₓ - xₘᵢₙ)
Для критериев, где меньше — лучше (цена), формула инвертируется:
nᵢ = (xₘₐₓ - xᵢ) / (xₘₐₓ - xₘᵢₙ)
Результат — значение от 0 до 1, где 1 = лучший показатель среди всех участников.
Плюсы: простота, интерпретируемость. Минусы: чувствительность к выбросам. Если один поставщик предложит аномально низкую цену, все остальные получат сжатые баллы в узком диапазоне.
nᵢ = (xᵢ - μ) / σ
Преобразует значения в количество стандартных отклонений от среднего. Устойчивее к выбросам, но результат не ограничен диапазоном [0, 1], что усложняет интерпретацию.
Для большинства закупочных скоринговых моделей оптимален Min-Max с виндзоризацией: перед нормализацией крайние значения (ниже 5-го и выше 95-го перцентиля) заменяются границами перцентилей. Это устраняет влияние выбросов, сохраняя простоту интерпретации.
AI не заменяет скоринговую модель — он автоматизирует самые трудоёмкие этапы и повышает объективность там, где ручной процесс наиболее уязвим.
LLM-модели (GPT-4, Claude, GigaChat) извлекают структурированные данные из неструктурированных заявок: парсинг технических предложений, извлечение SLA-параметров, распознавание сертификатов и лицензий. Это заменяет часы ручного разбора документов.
Практический pipeline:
AI проверяет наличие и валидность лицензий, сертификатов, допусков по базам данных (ФНС, РНП, реестры СРО). Это исключает человеческий фактор на этапе квалификационного отсева.
Наиболее ценное применение AI — оценка критериев, которые традиционно требуют экспертного суждения:
Главное преимущество AI-скоринга — воспроизводимость. Одна и та же заявка, поданная повторно, получит идентичный балл. Человеческий эксперт такой гарантии не даёт. Это критично для закупок, подлежащих аудиту и оспариванию.
| Критерий | Вес | Порог отсечения |
|---|---|---|
| Техническое соответствие ТЗ | 0.30 | soft: ≥ 0.5 |
| Опыт аналогичных проектов | 0.20 | soft: ≥ 3 проекта |
| Квалификация команды | 0.15 | — |
| Цена | 0.20 | — |
| SLA и гарантии | 0.10 | soft: uptime ≥ 99.5% |
| Финансовая устойчивость | 0.05 | hard: оборот ≥ 50% от суммы контракта |
Технические критерии доминируют (0.30 + 0.15 + 0.10 = 0.55). Цена значима, но не определяющая. Мягкий порог по техническому соответствию гарантирует, что дешёвое, но слабое предложение не пройдёт.
| Критерий | Вес | Порог отсечения |
|---|---|---|
| Цена (TCO) | 0.40 | — |
| Срок поставки | 0.20 | hard: ≤ 90 дней |
| Гарантийные условия | 0.15 | soft: ≥ 24 мес. |
| Соответствие спецификации | 0.15 | hard: 100% |
| Репутация поставщика | 0.10 | soft: рейтинг ≥ 3.5/5 |
Цена доминирует. Жёсткие пороги по сроку поставки и соответствию спецификации отсекают тех, кто не может выполнить базовые требования.
| Критерий | Вес | Порог отсечения |
|---|---|---|
| Релевантный отраслевой опыт | 0.30 | soft: ≥ 5 проектов в отрасли |
| Квалификация команды | 0.25 | soft: ≥ 2 эксперта с 10+ лет опыта |
| Методология и подход | 0.20 | — |
| Цена | 0.15 | — |
| Рекомендации и кейсы | 0.10 | — |
Здесь квалификация и опыт решают. Цена имеет минимальный вес — в консалтинге дешёвое предложение часто означает низкое качество.
Не стройте одну универсальную модель. Разделите закупки на 3–5 категорий и для каждой настройте свою конфигурацию весов и порогов.
Анализ прошлых закупок позволяет валидировать модель: сравните, совпадает ли ранжирование модели с фактическим качеством исполнения контрактов. Если поставщик с высоким скором систематически срывал сроки — пересмотрите веса.
Настройте pipeline для автоматического парсинга заявок. LLM-экстракция + валидационные правила + human-in-the-loop для спорных случаев.
Каждый балл должен быть декомпозируем: участник имеет право увидеть, за что получил какую оценку. AI-скоринг упрощает это — все расчёты логируются и воспроизводимы.
После каждого завершённого контракта обновляйте веса и пороги на основе фактического результата. Модель, которая не обучается на outcomes, деградирует.
Взвешенная скоринговая модель с AI-автоматизацией решает три ключевые задачи:
Это не замена экспертизы — это инструмент, который позволяет экспертам сосредоточиться на принятии решений, а не на разборе документов. Комиссия получает ранжированный список с обоснованием каждого балла и может сфокусировать внимание на пограничных случаях, а не на ручном перемалывании каждой заявки.
Модель скоринга — это не статичный артефакт. Это живая система, которая учится на результатах исполнения контрактов и становится точнее с каждым циклом закупок.
Подписывайтесь на наш канал: @vibelogia
Поделимся опытом
8 800 201 85 68