Скоринг поставщиков на AI: как перестать выбирать подрядчиков интуитивно и собрать модель, которая работает за вас

Как работает скоринг поставщиков на AI? Система оценки, взвешенная модель ранжирования и пороги отсечения для автоматизации тендеров.

VibeLab

Закупочная комиссия из пяти человек оценивает 30 заявок по 12 критериям. Это 1 800 экспертных оценок — и каждая подвержена усталости, настроению и когнитивным искажениям. Взвешенная скоринговая модель с AI-автоматизацией сводит субъективность к минимуму и сокращает цикл оценки с недель до часов. Разбираем архитектуру такой модели, методы нормализации, пороги отсечения и готовые конфигурации для разных категорий закупок.

Почему ручная оценка поставщиков больше не работает

По данным Минфина РФ, в 2023 году в рамках 44-ФЗ и 223-ФЗ проведено более 3,5 млн закупочных процедур. Средний конкурс с технически сложным предметом собирает от 8 до 25 заявок. Каждая заявка — это комплект документов на 50–200 страниц: техническое предложение, финансовые показатели, лицензии, референс-листы, SLA-обязательства.

Ручной разбор порождает три системные проблемы:

Субъективность. Два эксперта оценивают одно и то же техническое предложение и расходятся на 15–30%. Исследования в области decision science подтверждают: разброс экспертных оценок растёт с увеличением количества критериев и усталости оценщика.

Время. Полный цикл оценки конкурса с 15+ заявками занимает 2–4 недели. Это задерживает проект ещё до его старта.

Немасштабируемость. При росте объёма закупок нельзя линейно наращивать штат комиссии. А качество оценки при перегрузке падает нелинейно.

Автоматизация оценки тендерных заявок — не вопрос моды на AI. Это ответ на арифметику: при 20 заявках и 10 критериях ручная оценка генерирует 200 точек решения, каждая из которых — потенциальный источник ошибки или оспаривания.

Что такое взвешенная скоринговая модель: архитектура оценки

Скоринговая модель закупок — это формализованная система преобразования разнородных характеристик поставщика в единый числовой балл, пригодный для ранжирования.

Архитектура строится в четыре шага:

Определение критериев — что именно оцениваем (цена, опыт, SLA, финансовая устойчивость).
Назначение весов — какой критерий важнее для конкретной закупки.
Нормализация значений — приведение разнородных шкал к единому диапазону.
Расчёт итогового балла — агрегация нормализованных оценок с учётом весов.

Формула аддитивной модели:

S = Σ (wᵢ × nᵢ)

где S — итоговый скор, wᵢ — вес i-го критерия (сумма всех весов = 1), nᵢ — нормализованное значение i-го критерия.

Аддитивная vs. мультипликативная модель

Аддитивная модель (S = Σ wᵢ × nᵢ) допускает компенсацию: слабый показатель по одному критерию можно «перекрыть» сильным по другому. Мультипликативная (S = Π nᵢ^wᵢ) жёстче: провал по любому критерию резко снижает итоговый балл.

Для закупок с критическими требованиями безопасности (медицина, оборонка, инфраструктура) мультипликативная модель предпочтительнее — она не позволяет «спрятать» слабое место за счёт низкой цены.

На практике чаще применяют аддитивную модель с порогами отсечения — это даёт гибкость аддитивного подхода и жёсткость мультипликативного там, где она нужна.

Типы критериев и их относительная значимость

Критерии скоринга группируются в четыре категории:

Категория	Примеры критериев	Типичный диапазон весов
Ценовые	Цена контракта, TCO, условия оплаты	20–40%
Технические	Соответствие ТЗ, предложенный стек, SLA	25–40%
Квалификационные	Опыт аналогичных проектов, штат, сертификации	15–25%
Репутационные	История исполнения контрактов, отзывы, судебные дела	5–15%

Распределение весов — это не универсальная формула, а отражение приоритетов конкретной закупки. Для IT-закупки с высокими требованиями к качеству технические критерии получают 35–40%, а ценовые — 20–25%. Для товарной закупки стандартизированной продукции пропорция обратная.

Ключевой принцип: сумма весов всегда равна 1 (или 100%). Это дисциплина приоритизации. Если вы добавляете новый критерий, вы обязаны «забрать» вес у существующих, а не раздувать модель.

Пороги отсечения: фильтрация до ранжирования

Пороги отсечения работают как фильтр: поставщик, не прошедший порог, не участвует в ранжировании, независимо от остальных показателей.

Жёсткие пороги (hard knockout)

Бинарные: есть/нет. Наличие лицензии, допуск СРО, минимальный годовой оборот, отсутствие в реестре недобросовестных поставщиков. Это обязательные условия допуска, проверяемые до скоринга.

Примеры для IT-закупки:

Действующая лицензия ФСБ на работу с гостайной (если применимо).
Наличие сертификатов ISO 27001 / ISO 9001.
Минимальный годовой оборот — не менее 50% от суммы контракта.
Отсутствие в реестре недобросовестных поставщиков (РНП).

Мягкие пороги (soft threshold)

Минимально допустимое значение по отдельному критерию. Например: опыт аналогичных проектов — не менее 3, финансовая устойчивость (коэффициент текущей ликвидности) — не ниже 1,2. Поставщик с показателем ниже порога получает 0 баллов по критерию, но остаётся в ранжировании.

Комбинация жёстких и мягких порогов создаёт двухуровневую фильтрацию: сначала отсекаются заведомо непригодные участники, затем оставшиеся ранжируются с учётом штрафа за слабые показатели.

Нормализация: приведение к единой шкале

Ключевая техническая задача скоринга — привести разнородные показатели к единому диапазону. Цена измеряется в рублях, опыт — в количестве проектов, SLA — в процентах uptime. Без нормализации сравнение бессмысленно.

Min-Max нормализация

Самый распространённый метод:

nᵢ = (xᵢ - xₘᵢₙ) / (xₘₐₓ - xₘᵢₙ)

Для критериев, где меньше — лучше (цена), формула инвертируется:

nᵢ = (xₘₐₓ - xᵢ) / (xₘₐₓ - xₘᵢₙ)

Результат — значение от 0 до 1, где 1 = лучший показатель среди всех участников.

Плюсы: простота, интерпретируемость. Минусы: чувствительность к выбросам. Если один поставщик предложит аномально низкую цену, все остальные получат сжатые баллы в узком диапазоне.

Z-нормализация (стандартизация)

nᵢ = (xᵢ - μ) / σ

Преобразует значения в количество стандартных отклонений от среднего. Устойчивее к выбросам, но результат не ограничен диапазоном [0, 1], что усложняет интерпретацию.

Роль AI в скоринговой модели

AI не заменяет скоринговую модель — он автоматизирует самые трудоёмкие этапы и повышает объективность там, где ручной процесс наиболее уязвим.

Извлечение данных из документов

LLM-модели (GPT-4, Claude, GigaChat) извлекают структурированные данные из неструктурированных заявок: парсинг технических предложений, извлечение SLA-параметров, распознавание сертификатов и лицензий. Это заменяет часы ручного разбора документов.

Практический pipeline:

OCR/парсинг PDF → текстовое представление заявки.
LLM-экстракция → JSON с ключевыми параметрами по каждому критерию.
Валидация → проверка извлечённых данных на полноту и согласованность.
Подстановка в скоринговую модель → автоматический расчёт баллов.

Автоматическая проверка жёстких порогов

AI проверяет наличие и валидность лицензий, сертификатов, допусков по базам данных (ФНС, РНП, реестры СРО). Это исключает человеческий фактор на этапе квалификационного отсева.

Оценка качественных критериев

Наиболее ценное применение AI — оценка критериев, которые традиционно требуют экспертного суждения:

Качество технического предложения. LLM анализирует предложение на соответствие ТЗ, полноту, детализацию, наличие рисков и митигаций.
Релевантность опыта. AI сопоставляет описание прошлых проектов поставщика с требованиями текущей закупки, оценивая степень совпадения по технологическому стеку, масштабу и отрасли.
Финансовый анализ. Автоматический расчёт коэффициентов ликвидности, рентабельности, долговой нагрузки по загруженной бухгалтерской отчётности.

Снижение субъективности

Главное преимущество AI-скоринга — воспроизводимость. Одна и та же заявка, поданная повторно, получит идентичный балл. Человеческий эксперт такой гарантии не даёт. Это критично для закупок, подлежащих аудиту и оспариванию.

Три конфигурации скоринга для разных категорий закупок

Конфигурация 1: IT-услуги и разработка ПО

Критерий	Вес	Порог отсечения
Техническое соответствие ТЗ	0.30	soft: ≥ 0.5
Опыт аналогичных проектов	0.20	soft: ≥ 3 проекта
Квалификация команды	0.15	—
Цена	0.20	—
SLA и гарантии	0.10	soft: uptime ≥ 99.5%
Финансовая устойчивость	0.05	hard: оборот ≥ 50% от суммы контракта

Технические критерии доминируют (0.30 + 0.15 + 0.10 = 0.55). Цена значима, но не определяющая. Мягкий порог по техническому соответствию гарантирует, что дешёвое, но слабое предложение не пройдёт.

Конфигурация 2: Закупка стандартизированного оборудования

Критерий	Вес	Порог отсечения
Цена (TCO)	0.40	—
Срок поставки	0.20	hard: ≤ 90 дней
Гарантийные условия	0.15	soft: ≥ 24 мес.
Соответствие спецификации	0.15	hard: 100%
Репутация поставщика	0.10	soft: рейтинг ≥ 3.5/5

Цена доминирует. Жёсткие пороги по сроку поставки и соответствию спецификации отсекают тех, кто не может выполнить базовые требования.

Конфигурация 3: Консалтинг и профессиональные услуги

Критерий	Вес	Порог отсечения
Релевантный отраслевой опыт	0.30	soft: ≥ 5 проектов в отрасли
Квалификация команды	0.25	soft: ≥ 2 эксперта с 10+ лет опыта
Методология и подход	0.20	—
Цена	0.15	—
Рекомендации и кейсы	0.10	—

Здесь квалификация и опыт решают. Цена имеет минимальный вес — в консалтинге дешёвое предложение часто означает низкое качество.

Практика внедрения: от модели к работающей системе

Шаг 1. Определите категории закупок

Не стройте одну универсальную модель. Разделите закупки на 3–5 категорий и для каждой настройте свою конфигурацию весов и порогов.

Шаг 2. Соберите исторические данные

Анализ прошлых закупок позволяет валидировать модель: сравните, совпадает ли ранжирование модели с фактическим качеством исполнения контрактов. Если поставщик с высоким скором систематически срывал сроки — пересмотрите веса.

Шаг 3. Автоматизируйте извлечение данных

Настройте pipeline для автоматического парсинга заявок. LLM-экстракция + валидационные правила + human-in-the-loop для спорных случаев.

Шаг 4. Обеспечьте прозрачность

Каждый балл должен быть декомпозируем: участник имеет право увидеть, за что получил какую оценку. AI-скоринг упрощает это — все расчёты логируются и воспроизводимы.

Шаг 5. Итерируйте

После каждого завершённого контракта обновляйте веса и пороги на основе фактического результата. Модель, которая не обучается на outcomes, деградирует.

Итог

Взвешенная скоринговая модель с AI-автоматизацией решает три ключевые задачи:

Объективность — каждая оценка воспроизводима и декомпозируема.
Скорость — цикл оценки сокращается с недель до часов.
Масштабируемость — модель одинаково хорошо обрабатывает 5 и 500 заявок.

Это не замена экспертизы — это инструмент, который позволяет экспертам сосредоточиться на принятии решений, а не на разборе документов. Комиссия получает ранжированный список с обоснованием каждого балла и может сфокусировать внимание на пограничных случаях, а не на ручном перемалывании каждой заявки.

Модель скоринга — это не статичный артефакт. Это живая система, которая учится на результатах исполнения контрактов и становится точнее с каждым циклом закупок.

Подписывайтесь на наш канал: @vibelogia

Поделимся опытом

hello@vibelab.ru

8 800 201 85 68

Написать в Telegram