Средний юрист тратит 3–4 часа в день на поиск по кодексам и судебной практике — это 15–20 часов в неделю рутины вместо работы с клиентами. Мы в VibeLab построили RAG-систему для российской юрфирмы, которая находит релевантные нормы и прецеденты за 8–12 секунд с точностью 94%. Результат — экономия 12 часов в неделю на каждого юриста и возврат инвестиций за 4 месяца. Разбираем архитектуру, метрики и подводные камни внедрения.
Георгий
11 марта 2026 г.
Поделиться

Рынок LegalTech в России растёт на 25–30% ежегодно. По оценкам РБК, к 2025 году его объём превысил 8 млрд рублей. Но большинство юридических фирм до сих пор работают с правовыми базами так же, как 15 лет назад: открывают КонсультантПлюс или Гарант, вводят ключевые слова, листают десятки документов, вручную отбирают релевантные нормы.
Проблема не в самих базах — они полные и актуальные. Проблема в интерфейсе взаимодействия. Keyword-поиск требует от юриста точно знать, какие термины использованы в нужном документе. «Возмещение убытков при расторжении договора поставки» и «взыскание ущерба при отказе от исполнения контракта на поставку товаров» — это один и тот же запрос, но классический поиск обработает их по-разному.
Когда к нам обратилась юридическая фирма из Москвы (45 юристов, специализация — коммерческое право и арбитраж), задача звучала конкретно: сократить время поиска по нормативной базе и судебной практике минимум вдвое. Мы сократили его в 10–15 раз. Ниже — полный разбор: от архитектуры до расчёта ROI.
Retrieval-Augmented Generation (RAG) — это архитектурный паттерн, при котором языковая модель не генерирует ответ «из головы», а сначала находит релевантные фрагменты в базе знаний, а затем формулирует ответ на их основе. Для юриста это принципиально: каждое утверждение системы подкреплено ссылкой на конкретную норму или судебное решение.
Сравним подходы к поиску:
| Критерий | КонсультантПлюс / Гарант | RAG-система |
|---|---|---|
| Тип поиска | По ключевым словам | Семантический (по смыслу) |
| Обработка синонимов | Частичная (тезаурус) | Полная (embeddings) |
| Формат ответа | Список документов | Структурированный ответ со ссылками |
| Перекрёстный анализ | Ручной | Автоматический |
| Время на запрос | 15–40 минут | 8–12 секунд |
КонсультантПлюс и Гарант остаются основой — как источники данных. Но поисковый интерфейс к ним можно радикально улучшить, поставив поверх семантический слой.
Классический поиск сопоставляет слова в запросе со словами в документе. Семантический поиск работает иначе: он преобразует и запрос, и документы в числовые векторы (embeddings), которые отражают смысл, а не набор символов.
Процесс выглядит так:
Подготовка базы. Тексты кодексов, федеральных законов, судебных решений разбиваются на фрагменты (chunks) по 512–1024 токена с перекрытием в 10–15%. Для юридических текстов мы используем «умный» chunking — разбивку по статьям и пунктам, а не по фиксированному количеству символов. Это сохраняет логическую целостность нормы.
Векторизация. Каждый фрагмент превращается в вектор размерностью 1536 (для моделей OpenAI) или 1024 (для open-source моделей). Вектор — это «координата» смысла в многомерном пространстве. Фрагменты с близким смыслом оказываются рядом, даже если написаны разными словами.
Индексация. Векторы сохраняются в векторную базу данных (в нашем случае — pgvector как расширение PostgreSQL). Это позволяет искать ближайших «соседей» по смыслу за миллисекунды.
Поиск. Запрос юриста тоже превращается в вектор. Система находит 10–20 ближайших фрагментов из базы и передаёт их языковой модели вместе с запросом.
Генерация ответа. LLM формулирует ответ, опираясь строго на найденные фрагменты. Каждое утверждение сопровождается ссылкой: номер статьи, название закона, реквизиты судебного решения.
Для юридических текстов критично качество embeddings. Общие модели (например, text-embedding-3-large) справляются с 85–90% запросов. Оставшиеся 10–15% — это специфическая терминология, где мы дообучали embedding-модель на корпусе из 50 000+ юридических документов. Это подняло точность поиска с 87% до 94%.
Вот конкретный пример. Запрос: «Какой срок исковой давности по требованию о признании оспоримой сделки недействительной?»
GPT-4 без RAG ответил: «Срок исковой давности составляет 3 года с момента, когда лицо узнало о нарушении своего права (ст. 196 ГК РФ)». Это неверно. Статья 196 — про общий срок исковой давности, но для оспоримых сделок действует специальная норма.
RAG-система VibeLab ответила: «Срок исковой давности по требованию о признании оспоримой сделки недействительной и о применении последствий её недейс