Как AI снижает стоимость миграции с COBOL в 3–5 раз: разбор подхода и адаптация под российский GovTech

Модернизация COBOL: как AI экономит в 3 раза на анализе и тестировании. Подход Anthropic, адаптация под 152-ФЗ, ROI-расчёты и опыт GovTech-проектов VibeLab.

VibeLab

95% банкоматных транзакций в США работают на COBOL. В России доля legacy-кода в госсистемах и банках сопоставима — но специалистов, способных его поддерживать, с каждым годом меньше. Мы разобрали подход Anthropic к модернизации COBOL-систем и адаптировали его под реалии отечественного GovTech — с учётом 152-ФЗ, требований ФСТЭК и специфики госзакупок.

Почему COBOL до сих пор живёт в российских банках и госсистемах

Сотни миллиардов строк COBOL-кода работают в продакшене каждый день — в финансовом секторе, авиакомпаниях, государственных системах. Российская картина не менее масштабна: ядра процессинговых систем крупных банков, расчётные модули ФНС, системы Социального фонда России — всё это legacy, написанный десятилетия назад.

Проблема не в самом COBOL. Язык надёжен, код работает. Проблема в людях.

Средний возраст COBOL-разработчика в мире — 55+ лет. Язык преподают в единичных университетах. В России специалисты по мейнфреймам и COBOL уходят на пенсию, а подготовка новых практически не ведётся. Рынок труда для COBOL-разработчиков в РФ фактически мёртв.

Для руководителя ИТ-департамента банка или госоргана это означает конкретный риск: система работает, но любое изменение — от новой формы отчётности до интеграции с СМЭВ — превращается в проект с непредсказуемыми сроками и бюджетом.

Реальные цифры: почему миграция так дорого стоит

Классическая миграция COBOL-системы на современный стек — это проект на 5–10 лет с бюджетом, который заставляет ЛПР откладывать решение «до следующего года». И так — каждый год.

Основная стоимость — не в написании нового кода, а в понимании старого. Код модифицировали десятилетиями, документация отставала или вовсе отсутствует. Бизнес-логика существует только внутри самого кода.

Типичная структура затрат на миграцию legacy-системы средней сложности (500 000 строк COBOL):

Этап	Доля бюджета	Типичные сроки
Анализ и документирование	30–40%	12–18 месяцев
Проектирование целевой архитектуры	10–15%	3–6 месяцев
Разработка и трансляция кода	25–30%	12–24 месяца
Тестирование и валидация	15–20%	6–12 месяцев
Параллельный запуск и миграция данных	5–10%	3–6 месяцев

Анализ и документирование съедают до 40% бюджета. При ставке COBOL-консультанта от 5 000–10 000 ₽/час и потребности в 10–15 специалистах на полтора года речь идёт о десятках миллионов рублей — только на фазу анализа.

Для госсектора РФ добавляется ещё один фактор: закупочные процедуры по 44-ФЗ и 223-ФЗ. Любое увеличение сроков или стоимости — это новый цикл согласований. Результат предсказуем: модернизация откладывается, техдолг растёт.

Как AI меняет экономику миграции

Ключевой тезис: legacy-код стоило модернизировать давно, но понимание этого кода обходилось дороже его переписывания. AI переворачивает это уравнение.

AI не заменяет инженеров. Он автоматизирует самую дорогую и рутинную часть — исследование и анализ кодовой базы. Три ключевые задачи, которые AI решает в процессе миграции:

Автодокументирование — чтение и описание legacy-кода в human-readable формате
Трансляция кода — перевод бизнес-логики с COBOL на современные языки
Генерация тестов — создание покрытия для валидации миграции

Автодокументирование: когда никто не знает, что делает этот код

Типичная ситуация: система из 500 000 строк COBOL, последняя актуальная документация — 2008 год, автор кода уволился в 2015-м. Новый разработчик тратит 2–3 дня, чтобы разобраться в одном модуле.

AI меняет эту экономику радикально. LLM выполняет автоматизированное исследование кодовой базы:

Идентифицирует точки входа программ
Трассирует пути выполнения через вызываемые подпрограммы
Картирует потоки данных между модулями
Документирует зависимости, охватывающие сотни файлов

Критически важный момент: речь идёт не о простых call-графах. AI находит неявные зависимости — общие структуры данных, файловые операции, создающие связность между модулями, последовательности инициализации, влияющие на поведение в рантайме. Именно неявные зависимости — главный источник рисков при миграции.

Работа, которая занимала у специалиста 2–3 дня, выполняется за 15–30 минут с последующей верификацией.

Трансляция кода: от COBOL к современному языку

AI транслирует COBOL-логику в современные языки, создаёт API-обёртки вокруг legacy-компонентов и строит инфраструктуру для параллельного запуска старого и нового кода.

Ключевое отличие от наивного подхода: LLM транслирует бизнес-логику, а не просто синтаксис. COBOL-программа, обрабатывающая начисление пенсий, содержит десятки бизнес-правил, накопленных за годы. AI, получивший предварительно сгенерированную документацию и карту зависимостей, сохраняет семантику.

Но здесь нужна честность: риск галлюцинаций реален. LLM может неверно интерпретировать COBOL-специфичные конструкции — REDEFINES, PERFORM VARYING, обработку десятичной арифметики. AI-трансляция без ревью специалиста — рулетка. С ревью — инструмент, ускоряющий работу в 3–5 раз.

Практические меры митигации рисков:

Компонентная миграция: один модуль за раз, валидация на каждом шаге
Параллельный запуск: старый и новый код работают одновременно, результаты сравниваются
Экспертное ревью: каждый транслированный модуль проверяет инженер
Откат без потерь: если модуль не прошёл валидацию — откатывается только он

Генерация тестов: страховочная сетка перед миграцией

Bez тестов миграция — это прыжок вслепую. Legacy-системы, как правило, не имеют автоматизированных тестов. AI генерирует поведенческие тесты, фиксирующие текущее поведение системы как эталон.

Процесс:

AI анализирует модуль и определяет входные параметры и ожидаемые выходы
Генерирует набор тестовых сценариев, включая граничные случаи
Тесты запускаются на legacy-коде, результаты фиксируются как эталонные
После трансляции те же тесты запускаются на новом коде
Расхождения показывают, где трансляция нарушила логику

AI-генерация тестов сокращает время создания тестового покрытия на 60–70%. Оставшиеся 30–40% — экспертная верификация и доработка сценариев, которые AI не может сгенерировать без знания предметной области.

Ограничения AI: честный взгляд

Есть области, где без эксперта-человека не обойтись.

Специфика мейнфреймов. JCL-скрипты, управляющие запуском задач, — отдельный слой логики. Связки CICS/IMS, очереди MQ, взаимодействие с VSAM-файлами требуют специфической экспертизы.

Встроенная бизнес-логика без документации. Условие IF WS-REGION-CODE = '77' AND WS-DATE > 20150101 может отражать изменение законодательства, о котором знал только автор кода. AI увидит условие, но не поймёт, почему оно там.

Требования регулятора. Для систем под надзором ЦБ РФ или ФНС AI-транслированный код нужно не просто проверить — нужно доказать его эквивалентность оригиналу в формате, приемлемом для регулятора.

Данные и приватность. Для государственных систем часто необходим on-premise или air-gapped deployment — облачные AI-сервисы могут быть недоступны.

AI — мультипликатор эффективности эксперта, а не его замена.

Российский GovTech-контекст

Модернизация legacy в российском госсекторе имеет уникальные ограничения.

152-ФЗ и требования ФСТЭК. Персональные данные граждан не могут обрабатываться за пределами РФ. Решение — развёртывание LLM-инфраструктуры на собственных мощностях или в сертифицированных облаках. Open-source модели (LLaMA, Mistral, GigaChat, YandexGPT) могут частично закрыть эту потребность, хотя по качеству работы с COBOL пока уступают коммерческим аналогам.

Импортозамещение. Целевой стек миграции в госсекторе — это не всегда Java или Go. Регуляторные требования могут определять использование отечественных СУБД (Postgres Pro, Pangolin), ОС (Astra Linux, РЕД ОС). AI-ассистент должен генерировать код, совместимый с этим стеком.

Закупочные процедуры. Цикл от идеи до старта работ — 6–12 месяцев. AI-инструменты должны вписываться в эту реальность: быть обоснованными в ТЗ, иметь понятную стоимость, не создавать зависимость от зарубежного вендора.

Риск вендорлока. Архитектура решения должна позволять замену LLM-модели без переделки всего пайплайна. Абстракция над AI-слоем — не роскошь, а необходимость.

На практике AI-ассистированная миграция в российском госсекторе требует гибридного подхода: on-premise LLM для работы с чувствительным кодом, облачные модели для общих задач, и обязательно — команда с опытом в GovTech.

ROI-калькулятор: сколько экономит AI

Упрощённая модель расчёта для системы в 500 000 строк COBOL:

Параметр	Без AI	С AI-ассистентом
Документирование (человеко-часы)	8 000–12 000 ч	2 500–4 000 ч
Генерация тестов (человеко-часы)	4 000–6 000 ч	1 500–2 500 ч
Трансляция кода (человеко-часы)	10 000–15 000 ч	4 000–7 000 ч
Стоимость LLM API	—	500 000–1 500 000 ₽
Итого, фаза анализа + трансляция	110–330 млн ₽	40–105 млн ₽

Экономия: 60–70% на фазах анализа и документирования, 30–50% на трансляции и тестировании. Совокупное сокращение бюджета — в 2–3 раза. Сроки проекта сокращаются с 5–7 лет до 1,5–3 лет.

Формула для самостоятельного расчёта:

Экономия = (Часы_ручного_анализа × Ставка_специалиста) − (Часы_с_AI × Ставка_специалиста + Стоимость_LLM)

В большинстве случаев AI-ассистент окупается уже на фазе документирования.

Пошаговая модель: как начать прямо сейчас

Шаг 1. Аудит legacy-системы (2–4 недели). Определите объём COBOL-кода, критичность модулей, наличие документации, зависимости от мейнфрейм-инфраструктуры.

Шаг 2. AI-документирование (4–8 недель). Загрузите кодовую базу в LLM-пайплайн. Получите автоматическую документацию: описание модулей, потоки данных, зависимости. Верифицируйте результат с инженерами.

Шаг 3. Пилот на некритичном модуле (6–10 недель). Выполните полный цикл: документирование → генерация тестов → трансляция → валидация → параллельный запуск. Зафиксируйте метрики.

Шаг 4. Оценка и корректировка (2–3 недели). Скорректируйте подход на основе пилота. Пересчитайте бюджет и сроки для масштабирования.

Шаг 5. Масштабирование. Расширьте миграцию на следующие модули, приоритизируя по бизнес-ценности и техническому риску. Каждый модуль — отдельный цикл с валидацией.

Вместо заключения

Экономика модернизации COBOL-систем изменилась. То, что раньше стоило сотни миллионов рублей и занимало десятилетие, теперь можно сделать в 2–3 раза дешевле и быстрее. AI не убирает необходимость в экспертах — он убирает рутину, которая съедала 40% бюджета.

Для российского GovTech это особенно актуально: дефицит COBOL-специалистов, жёсткие регуляторные рамки и ограниченные бюджеты делают AI-ассистированную миграцию не опцией, а необходимостью.

Mы в VibeLab входим в тройку разработчиков ИИ в Санкт-Петербурге и реализовали более 20 проектов для компаний с оборотом от 1 млрд рублей. Если вы узнали в этой статье свою систему — напишите нам на hello@vibelab.ru. 30-минутная консультация по оценке готовности вашего legacy к AI-ассистированной миграции — бесплатно и без обязательств.