Как Wayfair автоматизировал каталог из 30 млн товаров с помощью ИИ — и что из этого применимо в российском ритейле

Как Wayfair автоматизировал каталог ИИ: 2,5 млн исправленных атрибутов, 41K тикетов/мес. Применимо ли к российскому ритейлу — разбор архитектуры, инструментов и roadmap внедрения.

VibeLab

У Wayfair около 30 миллионов SKU, распределённых по почти тысяче товарных классов. Каждый товар описывается десятками атрибутов: цвет, материал, размер, тип ножек, наличие ящиков. Эти атрибуты — не декоративная мелочь. От них зависят поиск, рекомендации, фильтры, мерчандайзинг и, в конечном счёте, процент возвратов.

До внедрения искусственного интеллекта Wayfair выявлял ошибки в атрибутах через жалобы поставщиков и покупателей. Ручная проверка не справлялась с объёмом. Первые попытки автоматизации — отдельная ML-модель под каждый тег — технически работали, но при 47 000 тегов подход оказался экономически нежизнеспособным. Кэролин Филлипс, staff ML scientist в Wayfair, описала проблему прямо: «Мы начали с индивидуальных моделей для каждого тега, и технически это работало. Но при 47 000 тегов такой подход не масштабируется».

Российский ритейл стоит перед той же задачей. Каталог крупного продавца на Wildberries — это десятки тысяч SKU с обязательными атрибутами, которые различаются для каждой категории. Ozon требует заполненности карточек на 80%+ для попадания в поисковую выдачу. Ручная разметка при ассортименте свыше 10 000 позиций — прямой путь к ошибкам и просадке видимости.

Задача 1: автоматическая разметка товарных атрибутов

Wayfair отказался от подхода «одна модель на один тег» и построил единую tag-agnostic систему на базе OpenAI. Ключевая идея — отделить знание о том, что означает каждый атрибут, от механизма классификации.

Архитектура pipeline

Pipeline устроен в четыре этапа:

Definition agent — компонент, который собирает определения для каждого тега из внешних источников и внутренней базы знаний. По словам Филлипс, «настоящим узким местом была не производительность модели, а время, которое люди тратили на формализацию значения каждого тега». Definition agent автоматизировал именно этот шаг.
Агрегация данных о товаре — система собирает описание, изображения и метаданные из разных источников в единый контекст для модели.
Классификация через LLM — единая модель получает контекст (определение тега + данные о товаре) и возвращает structured output с предсказанием атрибута и уровнем уверенности.
Валидация и запись — при высокой уверенности модели система автоматически перезаписывает атрибут и уведомляет поставщика. При низкой уверенности или для тегов с высоким риском — сначала запрашивает подтверждение.

Важная деталь: Wayfair не стал полностью доверять модели. Компания разработала процесс физической проверки — сотрудники осматривают образцы товаров и сверяют результат классификации с реальностью. Джессика Д'Арси, Associate Director of Catalog Merchandising, сформулировала так: «Чем выше качество данных, тем больше доверия покупателя. Это напрямую снижает возвраты из-за некорректного описания товара».

Архитектурно это prompt engineering с динамическим контекстом, а не fine-tuning отдельных моделей. Такой подход позволил команде наращивать покрытие новых атрибутов в 70 раз быстрее, чем годом ранее.

Метрики

2,5 млн товарных тегов исправлено
Охват — более 1 млн наиболее просматриваемых товаров
Скорость подключения новых атрибутов выросла в 70 раз
A/B-тест зафиксировал статистически значимый рост показов, кликов и позиций в поисковой выдаче
Планы — увеличить охват в 4 раза за следующие шесть месяцев

Параметр	До (bespoke-модели)	После (единая LLM)
Покрытие тегов	Единицы–десятки	47 000
Скорость подключения нового атрибута	Недели–месяцы	В 70 раз быстрее
Исправленных тегов	Ручная коррекция по жалобам	2,5 млн автоматически
Влияние на поиск	Не измерялось	Рост показов и кликов (A/B-тест)

Задача 2: триаж и автоматизация тикетов поддержки

Wayfair работает с десятками тысяч поставщиков. Каждый из них генерирует обращения: проблемы с листингом, вопросы по логистике, запросы на замену деталей. Грэм Ганссле из команды поддержки описал масштаб: «Обращения поставщиков покрывают сотни типов проблем, и ни один сотрудник не может реально разбираться во всех».

Wayfair развернул продукт Wilma — агентную систему поверх OpenAI API. Система читает входящее обращение, определяет intent поставщика, заполняет недостающий контекст из внутренних баз данных, при необходимости запрашивает уточнения и маршрутизирует тикет к нужной команде.

Помимо триажа, Wayfair запустил 12 агентных AI-потоков для конкретных команд. Ключевая метрика доверия — alignment rate: как часто рекомендация ИИ совпадает с финальным решением человека. Когда alignment стабильно превышает порог, workflow переключается из co-pilot в autopilot.

Результаты:

41 000 тикетов в месяц обрабатываются автоматически
До 70% автоматизации в отдельных workflow
Сокращение времени решения по нескольким типам обращений
Рост удовлетворённости поставщиков

RAG для поиска по каталогу

Фиона Тан, CTO Wayfair, обозначила вектор: «Покупатели часто не знают точных слов для того, что ищут. Естественный язык и мультимодальные модели помогают преодолеть этот разрыв».

Применительно к каталогу RAG работает так:

Описания и атрибуты товаров преобразуются в векторные эмбеддинги и сохраняются в векторную базу данных
Поисковый запрос пользователя тоже превращается в вектор
Система находит семантически близкие товары — не по точному совпадению слов, а по смыслу
LLM формирует ответ или ранжирует результаты с учётом найденного контекста

Практический пример: покупатель ищет «диван для маленькой гостиной в скандинавском стиле». Keyword-поиск будет искать точные слова. Векторный поиск найдёт компактные диваны с прямыми линиями, светлой обивкой и деревянными ножками — даже если в карточке нет слова «скандинавский».

Оптимальная архитектура — гибридный поиск: keyword + vector с re-ranking.

Перевод кейса на российский ритейл

Архитектура Wayfair не привязана к конкретному стеку. Принципы — единая модель, definition agent, structured output, staged rollout — переносимы.

Wildberries и Ozon. Маркетплейсы требуют заполненности карточек по жёстким шаблонам. Wildberries API позволяет загружать и обновлять карточки программно. Задача — автоматически извлечь атрибуты из описания поставщика и заполнить поля категории.

Собственный интернет-магазин с YML-каталогом. Обогащение YML-каталога атрибутами улучшает фильтрацию на сайте и повышает конверсию из поиска.

B2B-ритейл с 1С. Номенклатура в 1С часто содержит неструктурированные описания. Автоматическая классификация товаров и заполнение свойств по тексту описания — прямой аналог подхода Wayfair.

Интеграция с 1С

Архитектура:

Выгрузка из 1С — через HTTP-сервис формируется JSON с данными номенклатуры
Батчевая обработка — промежуточный сервис формирует промпты и отправляет в LLM API пакетами (5–10 товаров одной категории в один промпт)
Structured output — модель возвращает JSON с извлечёнными атрибутами и уровнем уверенности
Валидация — проверка на допустимые значения, диапазоны, обязательные поля
Запись обратно в 1С — через HTTP-сервис или COM-соединение

Пример промпта:

При confidence ниже 0.8 товар уходит на ручную проверку — прямой аналог подхода Wayfair с разделением на autopilot и co-pilot.

Пайплайн для маркетплейсов

Получить текущий шаблон характеристик категории через API маркетплейса
Загрузить описание товара от поставщика
Через LLM извлечь значения для обязательных полей
Валидировать по справочникам маркетплейса
Загрузить через API

Ключевой нюанс: маркетплейсы часто требуют значения из закрытых справочников. LLM может предложить «бежевый», а в справочнике Wildberries есть только «бежевый/кремовый». Здесь нужен дополнительный маппинг — через ещё один вызов LLM с передачей допустимых значений в промпте.

Выбор инструмента для российского рынка

OpenAI API (GPT-4o, GPT-4.1) — лучшее качество structured extraction, но данные уходят на серверы в США и оплата через зарубежное юрлицо.

YandexGPT — российское юрлицо, оплата в рублях, данные в РФ. Structured output менее стабилен.

Self-hosted (LLaMA 3, Qwen) — полный контроль над данными, LLaMA 3 70B и Qwen 2.5 72B сопоставимы с GPT-4o для задач извлечения атрибутов на русском. Нужна DevOps-экспертиза.

Критерий	OpenAI API	YandexGPT	Self-hosted
Качество на русском	Высокое	Хорошее	Высокое (70B+)
Structured output	Отличный	Нестабильный	Хороший (с vLLM)
Compliance (РФ)	Проблемно	Полностью	Полностью
Оплата в рублях	Нет	Да	Да
Порог входа	Низкий	Низкий	Средний–высокий

Для MVP оптимален OpenAI API или YandexGPT. Для production с требованиями к compliance — self-hosted через vLLM. Переход между ними не требует переписывания логики.

С чего начать

Чеклист готовности:

Размер каталога: менее 1 000 SKU — ИИ не нужен. От 5 000 — автоматизация окупается. От 50 000 — без неё не обойтись
Структурированность данных: есть ли текстовые описания? Если только артикул и цена — LLM не поможет
Частота обновления: если ассортимент обновляется на 20%+ в месяц, ручная разметка будет отставать
IT-ресурсы: нужен хотя бы один разработчик, способный работать с API

Три сценария:

MVP за 2 недели — 500–1000 товаров одной категории, промпт для извлечения атрибутов, прогон через API, замер точности. Вложения: время разработчика + $50–100 на API.

Production-решение за 1–3 месяца — батчевая обработка, валидация по справочникам, интеграция с каталогом, мониторинг качества. Команда 1–2 разработчика.

Enterprise-интеграция с RAG за 3–6 месяцев — автоматическая классификация + обогащение карточек + векторный поиск + автоматизация поддержки. ML-инженер + backend + DevOps.

Когда ИИ не нужен:

Каталог до 1 000 SKU с редкими обновлениями
Все атрибуты уже заполнены и поддерживаются поставщиками
Нет текстовых описаний и фотографий

Эффекты масштабируются нелинейно: чем больше SKU и чем чаще обновляется ассортимент, тем выше отдача. Wayfair с 30 млн SKU получил кратный эффект. Российский ритейлер с 50 000 SKU получит пропорционально меньший, но значимый результат — особенно в экономии времени на подготовку карточек для маркетплейсов.

Поделимся опытом

hello@vibelab.ru

8 800 201 85 68

Написать в Telegram