Запуск и анализ
После запуска эксперимент собирает данные. На финальном этапе вы принимаете продуктовое решение - раскатать изменение или остановить.
Отчёт по эксперименту обновляется раз в сутки. Сразу после старта посмотреть, как трафик разделился между группами, нельзя - первые цифры по распределению и метрикам появляются на следующий день.
Как оценивать качество данных
Прежде чем смотреть на рост метрик, проверьте, что эксперимент прошёл «чисто». На вкладке Health в Trisigma:
- SRM (Sample Ratio Mismatch) - проверка, что трафик распределился по группам в нужной пропорции (для 50/50 - около 50% в каждой). Если SRM красный - дальше можно не смотреть, что-то на стороне сплита.
- p-value - показывает, насколько вероятно, что разница между группами случайна. Чем меньше значение, тем больше уверенность, что разница реальная.
Принятие решения
Trisigma показывает результаты эксперимента, но не говорит, что с ними делать. А налитики вашей команды смотрят отчёт, делают ревью метрик и сами решают - раскатывать изменение, дорабатывать гипотезу или останавливать тест.
В Trisigma принят принцип «честной раскатки»: платформа не используется как сервис управления конфигурациями (Feature Toggle) на постоянной основе. Победивший вариант зафиксируйте в коде вашего приложения, экспериментальное ветвление - удалите. Иначе накапливается технический долг и архитектура усложняется.
Кейс для примера интеграции (Запуск и анализ)
Сквозной кейс из вступления: команда продукта проверяет, влияет ли цвет кнопки «Добавить в корзину» на количество кликов. Эксперимент шёл 14 дней. Дальше - как читать результаты.
Health Check
На вкладке Health SRM-тест зелёный, расхождение групп 0.0% - трафик разделился ровно, дальше смотрим метрику.
Анализ метрик
Lift по метрике users_clicked стабилизируется на уровне +5.7% при p-value = 0.012 - разница статистически значима. Гипотеза подтвердилась: синяя CTA-кнопка собирает больше кликов, чем серая.
Цифры по группам:
| Группа | Уникальных пользователей | Δ к контрольной |
|---|---|---|
control (серая кнопка) | 30 412 | - |
test (синяя кнопка) | 32 145 | +5.7% |
Решение
Раскатываем сини й вариант на 100% трафика:
- В коде убираем ветвление по лейблу - оставляем только синюю кнопку.
- На платформе переводим эксперимент в статус Finished.
Итог сквозного примера
На одном кейсе - проверка цвета кнопки «Добавить в корзину» - вы прошли все пять шагов интеграции с Trisigma:
- Подключение данных - подключили коннектор к таблице кликов в ClickHouse.
- Настройка метрик - описали SQL-источник
button_clicksи метрикуusers_clickedв Git-репозитории. - Создание эксперимента - завели эксперимент
blue_button_testс двумя группами (control/test) и привязали к нему метрикуusers_clicked. - Подключение сплиттера - в коде приложения вызвали
getFeaturesByTagдля разделения пользова телей иexposeManyV2для фиксации показов. - Запуск и анализ - 14 дней собирали данные, на 15-й день увидели рост
users_clickedна +5.7% приp-value = 0.012, гипотеза подтвердилась.
Тот же набор шагов работает для любой гипотезы - меняется конкретный SQL-источник, метрика, дизайн эксперимента и UI-изменение, структура остаётся.
Что дальше
Базовый путь от настройки источника данных до анализа результатов вы прошли. Дальше пригодятся:
- Статистический движок - методы расчёта p-value, SRM-теста и доверительных интервалов.
- API Сплиттера - справочник методов для сложных сценариев интеграции.
- Семантический слой - описание источников данных и сборка метрик.
Если что-то не складывается - команда поддержки Trisigma на связи.