Перейти к основному содержимому

Подключение данных

Trisigma использует pull-модель: платформа сама забирает данные из вашего хранилища по расписанию, а не ждёт отправки событий через API. SQL-запросы к данным выполняет встроенный движок Trino (ANSI SQL, совместимый с PostgreSQL).

Принципы работы с данными

Pull-модель обеспечивает надёжность и чистоту аналитики:

  1. Единый источник правды - метрики считаются на основе тех же данных, которые применяет ваша внутренняя аналитика.
  2. Нет потерь realtime-событий - если приложение временно не смогло отправить событие по сети, оно сохранится в DWH, и Trisigma заберёт его позже.
  3. Безопасность - платформа получает права только на чтение к ограниченному набору таблиц.

Процесс подключения

В интерфейсе платформы нет раздела для самостоятельной настройки коннекторов.

Чтобы подключиться:

  1. Предоставьте read-only доступ к необходимым таблицам в ClickHouse, Postgres или другом DWH.
  2. Сообщите инженерам Trisigma - они настроят Cron-задачи для регулярного забора данных.
  3. После настройки вы сможете описать данные в семантическом слое.

Подробнее о поддерживаемых источниках - в разделе Sources.

Для безопасной передачи данных Trisigma может настроить подключение через VPN-туннель. Сетевые инженеры Trisigma и со стороны клиента согласовывают параметры подключения в общем чате или по почте.

Кейс для примера интеграции (Подключение данных)

Сквозной кейс из вступления: команда продукта проверяет, влияет ли цвет кнопки «Добавить в корзину» на количество кликов. Чтобы это измерить, ей нужны данные о событиях пользователей - именно на этих данных считается метрика эксперимента.

В нашем кейсе события хранятся в ClickHouse. Команда Trisigma пишет в общий чат с командой продукта и запрашивает реквизиты подключения:

  1. host - адрес кластера ClickHouse, например rc1a-xxxx.mdb.yandexcloud.net.
  2. port - порт подключения, 8443 для HTTPS.
  3. database - имя базы, в которой лежит таблица событий.
  4. user и password - учётные данные read-only пользователя с доступом к таблице.

Команда передаёт реквизиты. Инженеры Trisigma настраивают коннектор и получают доступ к таблице событий с колонками:

  1. user_id - идентификатор пользователя, чтобы привязать клик к участнику эксперимента.
  2. event_type - тип события, например button_click.
  3. button_color - вариант кнопки, который видел пользователь (grey или blue).
  4. timestamp - время события, чтобы учитывать только клики в период эксперимента.

Пример строк:

user_idevent_typebutton_colortimestamp
1001button_clickblue2024-03-01 10:02:31
1002button_clickgrey2024-03-01 10:05:14
1003button_clickblue2024-03-01 10:07:45
1004button_clickgrey2024-03-01 10:11:02
1005button_clickblue2024-03-01 10:13:58
1006button_clickgrey2024-03-01 10:15:22
1007button_clickblue2024-03-01 10:18:47
1008button_clickblue2024-03-01 10:21:03
1009button_clickgrey2024-03-01 10:24:36
1010button_clickgrey2024-03-01 10:27:19

Когда данные доступны, на их основе можно описать источники и метрики эксперимента.

Следующий шаг - Настройка метрик.