Модернизация COBOL: как AI экономит в 3 раза на анализе и тестировании. Подход Anthropic, адаптация под 152-ФЗ, ROI-расчёты и опыт GovTech-проектов VibeLab.
VibeLab
Поделиться
95% банкоматных транзакций в США работают на COBOL. В России доля legacy-кода в госсистемах и банках сопоставима — но специалистов, способных его поддерживать, с каждым годом меньше. Мы разобрали подход Anthropic к модернизации COBOL-систем и адаптировали его под реалии отечественного GovTech — с учётом 152-ФЗ, требований ФСТЭК и специфики госзакупок.
Сотни миллиардов строк COBOL-кода работают в продакшене каждый день — в финансовом секторе, авиакомпаниях, государственных системах. Российская картина не менее масштабна: ядра процессинговых систем крупных банков, расчётные модули ФНС, системы Социального фонда России — всё это legacy, написанный десятилетия назад.
Проблема не в самом COBOL. Язык надёжен, код работает. Проблема в людях.
Средний возраст COBOL-разработчика в мире — 55+ лет. Язык преподают в единичных университетах. В России специалисты по мейнфреймам и COBOL уходят на пенсию, а подготовка новых практически не ведётся. Рынок труда для COBOL-разработчиков в РФ фактически мёртв.
Для руководителя ИТ-департамента банка или госоргана это означает конкретный риск: система работает, но любое изменение — от новой формы отчётности до интеграции с СМЭВ — превращается в проект с непредсказуемыми сроками и бюджетом.
Классическая миграция COBOL-системы на современный стек — это проект на 5–10 лет с бюджетом, который заставляет ЛПР откладывать решение «до следующего года». И так — каждый год.
Основная стоимость — не в написании нового кода, а в понимании старого. Код модифицировали десятилетиями, документация отставала или вовсе отсутствует. Бизнес-логика существует только внутри самого кода.
Типичная структура затрат на миграцию legacy-системы средней сложности (500 000 строк COBOL):
| Этап | Доля бюджета | Типичные сроки |
|---|---|---|
| Анализ и документирование | 30–40% | 12–18 месяцев |
| Проектирование целевой архитектуры | 10–15% | 3–6 месяцев |
| Разработка и трансляция кода | 25–30% | 12–24 месяца |
| Тестирование и валидация | 15–20% | 6–12 месяцев |
| Параллельный запуск и миграция данных | 5–10% | 3–6 месяцев |
Анализ и документирование съедают до 40% бюджета. При ставке COBOL-консультанта от 5 000–10 000 ₽/час и потребности в 10–15 специалистах на полтора года речь идёт о десятках миллионов рублей — только на фазу анализа.
Для госсектора РФ добавляется ещё один фактор: закупочные процедуры по 44-ФЗ и 223-ФЗ. Любое увеличение сроков или стоимости — это новый цикл согласований. Результат предсказуем: модернизация откладывается, техдолг растёт.
Ключевой тезис: legacy-код стоило модернизировать давно, но понимание этого кода обходилось дороже его переписывания. AI переворачивает это уравнение.
AI не заменяет инженеров. Он автоматизирует самую дорогую и рутинную часть — исследование и анализ кодовой базы. Три ключевые задачи, которые AI решает в процессе миграции:
Типичная ситуация: система из 500 000 строк COBOL, последняя актуальная документация — 2008 год, автор кода уволился в 2015-м. Новый разработчик тратит 2–3 дня, чтобы разобраться в одном модуле.
AI меняет эту экономику радикально. LLM выполняет автоматизированное исследование кодовой базы:
Критически важный момент: речь идёт не о простых call-графах. AI находит неявные зависимости — общие структуры данных, файловые операции, создающие связность между модулями, последовательности инициализации, влияющие на поведение в рантайме. Именно неявные зависимости — главный источник рисков при миграции.
Работа, которая занимала у специалиста 2–3 дня, выполняется за 15–30 минут с последующей верификацией.
AI транслирует COBOL-логику в современные языки, создаёт API-обёртки вокруг legacy-компонентов и строит инфраструктуру для параллельного запуска старого и нового кода.
Ключевое отличие от наивного подхода: LLM транслирует бизнес-логику, а не просто синтаксис. COBOL-программа, обрабатывающая начисление пенсий, содержит десятки бизнес-правил, накопленных за годы. AI, получивший предварительно сгенерированную документацию и карту зависимостей, сохраняет семантику.
Но здесь нужна честность: риск галлюцинаций реален. LLM может неверно интерпретировать COBOL-специфичные конструкции — REDEFINES, PERFORM VARYING, обработку десятичной арифметики. AI-трансляция без ревью специалиста — рулетка. С ревью — инструмент, ускоряющий работу в 3–5 раз.
Практические меры митигации рисков:
Bez тестов миграция — это прыжок вслепую. Legacy-системы, как правило, не имеют автоматизированных тестов. AI генерирует поведенческие тесты, фиксирующие текущее поведение системы как эталон.
Процесс:
AI-генерация тестов сокращает время создания тестового покрытия на 60–70%. Оставшиеся 30–40% — экспертная верификация и доработка сценариев, которые AI не может сгенерировать без знания предметной области.
Есть области, где без эксперта-человека не обойтись.
Специфика мейнфреймов. JCL-скрипты, управляющие запуском задач, — отдельный слой логики. Связки CICS/IMS, очереди MQ, взаимодействие с VSAM-файлами требуют специфической экспертизы.
Встроенная бизнес-логика без документации. Условие IF WS-REGION-CODE = '77' AND WS-DATE > 20150101 может отражать изменение законодательства, о котором знал только автор кода. AI увидит условие, но не поймёт, почему оно там.
Требования регулятора. Для систем под надзором ЦБ РФ или ФНС AI-транслированный код нужно не просто проверить — нужно доказать его эквивалентность оригиналу в формате, приемлемом для регулятора.
Данные и приватность. Для государственных систем часто необходим on-premise или air-gapped deployment — облачные AI-сервисы могут быть недоступны.
AI — мультипликатор эффективности эксперта, а не его замена.
Модернизация legacy в российском госсекторе имеет уникальные ограничения.
152-ФЗ и требования ФСТЭК. Персональные данные граждан не могут обрабатываться за пределами РФ. Решение — развёртывание LLM-инфраструктуры на собственных мощностях или в сертифицированных облаках. Open-source модели (LLaMA, Mistral, GigaChat, YandexGPT) могут частично закрыть эту потребность, хотя по качеству работы с COBOL пока уступают коммерческим аналогам.
Импортозамещение. Целевой стек миграции в госсекторе — это не всегда Java или Go. Регуляторные требования могут определять использование отечественных СУБД (Postgres Pro, Pangolin), ОС (Astra Linux, РЕД ОС). AI-ассистент должен генерировать код, совместимый с этим стеком.
Закупочные процедуры. Цикл от идеи до старта работ — 6–12 месяцев. AI-инструменты должны вписываться в эту реальность: быть обоснованными в ТЗ, иметь понятную стоимость, не создавать зависимость от зарубежного вендора.
Риск вендорлока. Архитектура решения должна позволять замену LLM-модели без переделки всего пайплайна. Абстракция над AI-слоем — не роскошь, а необходимость.
На практике AI-ассистированная миграция в российском госсекторе требует гибридного подхода: on-premise LLM для работы с чувствительным кодом, облачные модели для общих задач, и обязательно — команда с опытом в GovTech.
Упрощённая модель расчёта для системы в 500 000 строк COBOL:
| Параметр | Без AI | С AI-ассистентом |
|---|---|---|
| Документирование (человеко-часы) | 8 000–12 000 ч | 2 500–4 000 ч |
| Генерация тестов (человеко-часы) | 4 000–6 000 ч | 1 500–2 500 ч |
| Трансляция кода (человеко-часы) | 10 000–15 000 ч | 4 000–7 000 ч |
| Стоимость LLM API | — | 500 000–1 500 000 ₽ |
| Итого, фаза анализа + трансляция | 110–330 млн ₽ | 40–105 млн ₽ |
Экономия: 60–70% на фазах анализа и документирования, 30–50% на трансляции и тестировании. Совокупное сокращение бюджета — в 2–3 раза. Сроки проекта сокращаются с 5–7 лет до 1,5–3 лет.
Формула для самостоятельного расчёта:
Экономия = (Часы_ручного_анализа × Ставка_специалиста) − (Часы_с_AI × Ставка_специалиста + Стоимость_LLM)
В большинстве случаев AI-ассистент окупается уже на фазе документирования.
Шаг 1. Аудит legacy-системы (2–4 недели). Определите объём COBOL-кода, критичность модулей, наличие документации, зависимости от мейнфрейм-инфраструктуры.
Шаг 2. AI-документирование (4–8 недель). Загрузите кодовую базу в LLM-пайплайн. Получите автоматическую документацию: описание модулей, потоки данных, зависимости. Верифицируйте результат с инженерами.
Шаг 3. Пилот на некритичном модуле (6–10 недель). Выполните полный цикл: документирование → генерация тестов → трансляция → валидация → параллельный запуск. Зафиксируйте метрики.
Шаг 4. Оценка и корректировка (2–3 недели). Скорректируйте подход на основе пилота. Пересчитайте бюджет и сроки для масштабирования.
Шаг 5. Масштабирование. Расширьте миграцию на следующие модули, приоритизируя по бизнес-ценности и техническому риску. Каждый модуль — отдельный цикл с валидацией.
Экономика модернизации COBOL-систем изменилась. То, что раньше стоило сотни миллионов рублей и занимало десятилетие, теперь можно сделать в 2–3 раза дешевле и быстрее. AI не убирает необходимость в экспертах — он убирает рутину, которая съедала 40% бюджета.
Для российского GovTech это особенно актуально: дефицит COBOL-специалистов, жёсткие регуляторные рамки и ограниченные бюджеты делают AI-ассистированную миграцию не опцией, а необходимостью.
Mы в VibeLab входим в тройку разработчиков ИИ в Санкт-Петербурге и реализовали более 20 проектов для компаний с оборотом от 1 млрд рублей. Если вы узнали в этой статье свою систему — напишите нам на hello@vibelab.ru. 30-минутная консультация по оценке готовности вашего legacy к AI-ассистированной миграции — бесплатно и без обязательств.