Как Wayfair автоматизировал каталог ИИ: 2,5 млн исправленных атрибутов, 41K тикетов/мес. Применимо ли к российскому ритейлу — разбор архитектуры, инструментов и roadmap внедрения.
VibeLab
Поделиться

У Wayfair около 30 миллионов SKU, распределённых по почти тысяче товарных классов. Каждый товар описывается десятками атрибутов: цвет, материал, размер, тип ножек, наличие ящиков. Эти атрибуты — не декоративная мелочь. От них зависят поиск, рекомендации, фильтры, мерчандайзинг и, в конечном счёте, процент возвратов.
До внедрения искусственного интеллекта Wayfair выявлял ошибки в атрибутах через жалобы поставщиков и покупателей. Ручная проверка не справлялась с объёмом. Первые попытки автоматизации — отдельная ML-модель под каждый тег — технически работали, но при 47 000 тегов подход оказался экономически нежизнеспособным. Кэролин Филлипс, staff ML scientist в Wayfair, описала проблему прямо: «Мы начали с индивидуальных моделей для каждого тега, и технически это работало. Но при 47 000 тегов такой подход не масштабируется».
Российский ритейл стоит перед той же задачей. Каталог крупного продавца на Wildberries — это десятки тысяч SKU с обязательными атрибутами, которые различаются для каждой категории. Ozon требует заполненности карточек на 80%+ для попадания в поисковую выдачу. Ручная разметка при ассортименте свыше 10 000 позиций — прямой путь к ошибкам и просадке видимости.
Wayfair отказался от подхода «одна модель на один тег» и построил единую tag-agnostic систему на базе OpenAI. Ключевая идея — отделить знание о том, что означает каждый атрибут, от механизма классификации.
Pipeline устроен в четыре этапа:
Definition agent — компонент, который собирает определения для каждого тега из внешних источников и внутренней базы знаний. По словам Филлипс, «настоящим узким местом была не производительность модели, а время, которое люди тратили на формализацию значения каждого тега». Definition agent автоматизировал именно этот шаг.
Агрегация данных о товаре — система собирает описание, изображения и метаданные из разных источников в единый контекст для модели.
Классификация через LLM — единая модель получает контекст (определение тега + данные о товаре) и возвращает structured output с предсказанием атрибута и уровнем уверенности.
Валидация и запись — при высокой уверенности модели система автоматически перезаписывает атрибут и уведомляет поставщика. При низкой уверенности или для тегов с высоким риском — сначала запрашивает подтверждение.
Важная деталь: Wayfair не стал полностью доверять модели. Компания разработала процесс физической проверки — сотрудники осматривают образцы товаров и сверяют результат классификации с реальностью. Джессика Д'Арси, Associate Director of Catalog Merchandising, сформулировала так: «Чем выше качество данных, тем больше доверия покупателя. Это напрямую снижает возвраты из-за некорректного описания товара».
Архитектурно это prompt engineering с динамическим контекстом, а не fine-tuning отдельных моделей. Такой подход позволил команде наращивать покрытие новых атрибутов в 70 раз быстрее, чем годом ранее.
| Параметр | До (bespoke-модели) | После (единая LLM) |
|---|---|---|
| Покрытие тегов | Единицы–десятки | 47 000 |
| Скорость подключения нового атрибута | Недели–месяцы | В 70 раз быстрее |
| Исправленных тегов | Ручная коррекция по жалобам | 2,5 млн автоматически |
| Влияние на поиск | Не измерялось | Рост показов и кликов (A/B-тест) |
Wayfair работает с десятками тысяч поставщиков. Каждый из них генерирует обращения: проблемы с листингом, вопросы по логистике, запросы на замену деталей. Грэм Ганссле из команды поддержки описал масштаб: «Обращения поставщиков покрывают сотни типов проблем, и ни один сотрудник не может реально разбираться во всех».
Wayfair развернул продукт Wilma — агентную систему поверх OpenAI API. Система читает входящее обращение, определяет intent поставщика, заполняет недостающий контекст из внутренних баз данных, при необходимости запрашивает уточнения и маршрутизирует тикет к нужной команде.
Помимо триажа, Wayfair запустил 12 агентных AI-потоков для конкретных команд. Ключевая метрика доверия — alignment rate: как часто рекомендация ИИ совпадает с финальным решением человека. Когда alignment стабильно превышает порог, workflow переключается из co-pilot в autopilot.
Результаты:
Фиона Тан, CTO Wayfair, обозначила вектор: «Покупатели часто не знают точных слов для того, что ищут. Естественный язык и мультимодальные модели помогают преодолеть этот разрыв».
Применительно к каталогу RAG работает так:
Практический пример: покупатель ищет «диван для маленькой гостиной в скандинавском стиле». Keyword-поиск будет искать точные слова. Векторный поиск найдёт компактные диваны с прямыми линиями, светлой обивкой и деревянными ножками — даже если в карточке нет слова «скандинавский».
Оптимальная архитектура — гибридный поиск: keyword + vector с re-ranking.
Архитектура Wayfair не привязана к конкретному стеку. Принципы — единая модель, definition agent, structured output, staged rollout — переносимы.
Wildberries и Ozon. Маркетплейсы требуют заполненности карточек по жёстким шаблонам. Wildberries API позволяет загружать и обновлять карточки программно. Задача — автоматически извлечь атрибуты из описания поставщика и заполнить поля категории.
Собственный интернет-магазин с YML-каталогом. Обогащение YML-каталога атрибутами улучшает фильтрацию на сайте и повышает конверсию из поиска.
B2B-ритейл с 1С. Номенклатура в 1С часто содержит неструктурированные описания. Автоматическая классификация товаров и заполнение свойств по тексту описания — прямой аналог подхода Wayfair.
Архитектура:
Пример промпта:
При confidence ниже 0.8 товар уходит на ручную проверку — прямой аналог подхода Wayfair с разделением на autopilot и co-pilot.
Ключевой нюанс: маркетплейсы часто требуют значения из закрытых справочников. LLM может предложить «бежевый», а в справочнике Wildberries есть только «бежевый/кремовый». Здесь нужен дополнительный маппинг — через ещё один вызов LLM с передачей допустимых значений в промпте.
OpenAI API (GPT-4o, GPT-4.1) — лучшее качество structured extraction, но данные уходят на серверы в США и оплата через зарубежное юрлицо.
YandexGPT — российское юрлицо, оплата в рублях, данные в РФ. Structured output менее стабилен.
Self-hosted (LLaMA 3, Qwen) — полный контроль над данными, LLaMA 3 70B и Qwen 2.5 72B сопоставимы с GPT-4o для задач извлечения атрибутов на русском. Нужна DevOps-экспертиза.
| Критерий | OpenAI API | YandexGPT | Self-hosted |
|---|---|---|---|
| Качество на русском | Высокое | Хорошее | Высокое (70B+) |
| Structured output | Отличный | Нестабильный | Хороший (с vLLM) |
| Compliance (РФ) | Проблемно | Полностью | Полностью |
| Оплата в рублях | Нет | Да | Да |
| Порог входа | Низкий | Низкий | Средний–высокий |
Для MVP оптимален OpenAI API или YandexGPT. Для production с требованиями к compliance — self-hosted через vLLM. Переход между ними не требует переписывания логики.
Чеклист готовности:
Три сценария:
MVP за 2 недели — 500–1000 товаров одной категории, промпт для извлечения атрибутов, прогон через API, замер точности. Вложения: время разработчика + $50–100 на API.
Production-решение за 1–3 месяца — батчевая обработка, валидация по справочникам, интеграция с каталогом, мониторинг качества. Команда 1–2 разработчика.
Enterprise-интеграция с RAG за 3–6 месяцев — автоматическая классификация + обогащение карточек + векторный поиск + автоматизация поддержки. ML-инженер + backend + DevOps.
Когда ИИ не нужен:
Эффекты масштабируются нелинейно: чем больше SKU и чем чаще обновляется ассортимент, тем выше отдача. Wayfair с 30 млн SKU получил кратный эффект. Российский ритейлер с 50 000 SKU получит пропорционально меньший, но значимый результат — особенно в экономии времени на подготовку карточек для маркетплейсов.
Поделимся опытом
8 800 201 85 68