Оптимизация операционных показателей федеральной сети кинотеатров

Разработка и внедрение системы предиктивной реактивации клиентов на основе глубокого анализа данных DataBox

20 слайдов | Спецкурс: Консалтинг на основе анализа данных

Проект структурирован по классической консалтинговой рамке из 5 этапов
1. Подготовка
Цели и гипотезы
2. Диагностика
Анализ 360°
3. Дизайн
ML-моделирование
4. Итоги
ROI и Эффекты
5. Внедрение
Roadmap

Данный подход обеспечивает сквозную прослеживаемость от бизнес-проблемы до технической реализации и финального финансового результата.

Снижение органического трафика требует перехода от стратегии привлечения к стратегии удержания

Текущая ситуация

Рынок кинопроката в 2024-2025 гг. характеризуется изменением структуры контента. Стоимость привлечения нового клиента (CAC) выросла на 24% год к году. При этом внутренняя база лояльности используется лишь на 15% от своего потенциала.

Ключевой риск: Потеря "ядра" аудитории из-за отсутствия релевантного предложения в периоды отсутствия блокбастеров.

Бизнес-задача

Сформировать механизм, позволяющий предсказывать интерес пользователя к "нишевому" контенту и возвращать его в кинотеатр в будние дни, когда средняя загрузка залов минимальна.

Цели проекта декомпозированы на операционные, финансовые и технические метрики
Финансовые цели
  • Рост выручки по сегменту "спящих" клиентов на 12.5 млн руб./мес.
  • Увеличение среднегодового LTV на 15%.
  • Окупаемость проекта (Payback period) < 4 месяцев.
Технические цели
  • Сбор и очистка данных из 4+ источников.
  • Разработка модели с метрикой ROC-AUC > 0.82.
  • Автоматизация выгрузки триггеров в CRM-систему с задержкой < 1 часа.
Организационный анализ выявил разрыв между маркетинговой активностью и реальным спросом

Структура клиента

Объект: Федеральная сеть кинотеатров "Синема-Тех". Централизованный офис маркетинга, 45 региональных представительств. Единая база лояльности DataBox.

  • Продукт: Широкий прокат + событийное кино.
  • Каналы: Мобильное приложение (500к уст.), Email, SMS.
Проблема процессов: Текущий маркетинг работает по принципу "Push All". Все клиенты получают одинаковые уведомления о главных премьерах, что ведет к росту отписок (Churn rate по рассылкам — 2.1% в месяц).
Финансовые показатели за 2023-2025 гг. подтверждают негативный тренд удержания (Retention)
[График: Динамика визитов по когортам]

Анализ когорт показывает, что клиенты, пришедшие в 2023 году, совершают повторный визит в 2024 году лишь в 18% случаев.

Детализация отчета

  • Выручка: Стабильна (+2% за счет цены), но объем трафика упал на 14%.
  • Маржа: Снижается из-за роста операционных расходов на содержание залов при низкой посещаемости в будни.
  • Доп. доход: Спад продаж в баре на 8% из-за изменения портфеля клиента.
Бенчмаркинг подтверждает наличие нереализованного потенциала в 6-10 п.п. загрузки
12.2%
Наш кейс
18.5%
Рынок РФ (ср)
24.0%
Мировой лидер

Gap-анализ: Отставание от рынка обусловлено низкой эффективностью работы со "вторым визитом". Лидеры используют системы AI-рекомендаций для заполнения утренних и дневных сеансов.

Анализ маркетинговых инструментов выявил неэффективное распределение бюджета
Эффективность каналов (As-Is):
  • Email: Open Rate 12%, CTR 0.8%.
  • Push: Open Rate 4%, Conversion 0.5%.
  • Social: Высокий охват, низкая атрибуция к продажам.

Проблема "релевантности"

В ходе интервью с отделом маркетинга выявлено, что сегментация проводится вручную по 2-3 признакам (пол, возраст). Глубокие поведенческие паттерны (Affinity к актерам, режиссерам, времени сеанса) игнорируются.

Результаты качественного анализа: боли сотрудников и ожидания клиентов

"Мы видим, что залы пустуют во вторник, но у нас нет инструмента, чтобы пригласить именно тех людей, которым понравится текущий арт-хаус фильм."

— Руководитель отдела планирования расписания

"Данные в DataBox копились годами, но мы использовали их только для выдачи бонусных карт, а не для аналитики спроса."

— IT-директор
Оценка кадрового потенциала выявила нехватку Data-компетенций в штате
РольНаличиеОценка компетенций
Маркетологи6 чел.Высокие (Креатив), Низкие (Данные)
IT-поддержка4 чел.Средние (Администрирование)
Data Analysts0 чел.
Рекомендация: Для реализации проекта необходимо привлечение внешнего консалтинга на этапе дизайна и найм 1-2 внутренних аналитиков для поддержки системы.
Сбор и интеграция данных: формирование "Озера данных" для обучения модели
  • DataBox API: Первичные транзакции, ID билетов, способы оплаты, использование бонусов.
  • CRM Logs: История заходов в приложение, время просмотра страниц фильмов.
  • External API: Скрапинг данных о фильмах (бюджеты, кассовые сборы, оценки критиков).
  • Survey Data: Результаты опросов после посещения (NPS).
Очистка данных: Исключение выбросов (корпоративные закупки), обработка пропусков в профилях клиентов (65% заполненность).
Формализация Target Variable: переход от абстрактных целей к математической задаче

Target: Binary Classification (0/1)

Будет ли совершена покупка билета (True) конкретным пользователем (User_ID) на конкретный фильм (Movie_ID) в течение следующего окна прогноза (7 дней).

Почему бинарная?

Это позволяет бизнесу четко определить действие: если P > threshold, мы отправляем оффер. Это снижает затраты на избыточные коммуникации и сохраняет лояльность.

Ожидаемые классы:
  • 1: Покупка совершена.
  • 0: Отсутствие покупки в целевой период.
Feature Engineering: создание 150+ признаков для повышения точности прогноза
User Behavioral Features
  • Дней с последнего визита (Recency).
  • Доля вечерних сеансов.
  • Любимый тип зала (Standard vs Premium).
  • Среднее кол-во билетов в заказе.
Contextual Affinity Features
  • Совпадение жанра с историей посещений.
  • Интерес к конкретному актеру (коэффициент сродства).
  • Чувствительность к скидкам (использование промокодов).
Архитектура решения: каскад моделей для максимизации точности отбора

Используемый алгоритм: LightGBM Classifier с оптимизацией гиперпараметров через Optuna.

  • Кросс-валидация: Time-series split (учет временной зависимости).
  • Метрики: F1-score (баланс Precision/Recall) и Lift.
Бизнес-процесс после внедрения: Еженедельный запуск скоринга всей базы -> Выделение ТОП-5% склонных к покупке -> Автоматическая отправка уведомления.
Результаты A/B тестирования подтвердили превосходство ML-подхода над экспертным
1.4% Конверсия (Control Group) Случайная выборка / Масс-маркет
5.8% Конверсия (Test Group) ML-таргетинг
Вывод: Мы получили 4-кратный прирост эффективности контактов при снижении объема рассылок на 60%.
Расчет ROI и финансового влияния на EBITDA в годовом исчислении
ПоказательМесяц (Прогноз)Год (Прогноз)
Доп. выручка (Incremental)4.2 млн руб.50.4 млн руб.
Затраты на внедрение (CAPEX)1.5 млн руб.
Затраты на поддержку (OPEX)0.3 млн руб.3.6 млн руб.
Чистый эффект3.9 млн руб.45.3 млн руб.
Срок окупаемости: Менее 1 месяца после полноценного развертывания.
Стратегические преимущества: данные как долгосрочный актив компании
  • Лояльность: Снижение уровня спама повысило индекс удовлетворенности клиентов (CSAT).
  • Переговоры со студиями: Теперь мы можем гарантировать дистрибьюторам охват именно целевой аудитории (например, любителей хорроров).
  • Инфраструктура: Построено готовое решение, которое можно масштабировать на продажи в баре и онлайн-кинотеатр.
Техническая интеграция и автоматизация маркетингового цикла

Система интегрируется в существующий IT-ландшафт через шину данных. Модель разворачивается в Docker-контейнере.

Технологический стек: Python (FastAPI), Airflow (оркестрация), PostgreSQL (хранилище признаков), MLflow (трекинг моделей).
Трансформация операционной модели и обучение команды
  • Создание роли Data Product Owner внутри отдела маркетинга.
  • Проведение обучающих воркшопов по интерпретации результатов модели.
  • Внедрение KPI для менеджеров, завязанных на "Инкрементальную выручку", а не на "Охваты".
График реализации проекта: от MVP к промышленной эксплуатации
W1-W3
Анализ и ETL
W4-W7
Разработка ML
W8-W10
Тесты и Пилот
W11-W12
Roll-out

Проект готов к масштабированию

Переход на Data-Driven модель консалтинга позволяет не только закрыть текущий Gap в доходах, но и создать устойчивое конкурентное преимущество.

Спасибо за внимание!

Вопросы и обсуждение