Требования к инфраструктуре
PostgreSQL
Рекомендуем использовать отдельный экземпляр PostgreSQL для каждого сервиса: Splitter, Configurator, Trino + Hive, Airflow.
| Параметр | Значение |
|---|---|
| Версия | 15 |
| Extensions | uuid-ossp, intarray, btree_gist, pg_trgm |
Рекомендуется использовать connection pooler (pgbouncer) в режиме TRANSACTION.
Valkey
Рекомендуем использовать отдельный экземпляр для Configurator и Airflow.
| Параметр | Значение |
|---|---|
| Версия | 8.1 |
ClickHouse
Один кластер на всю платформу.
| Параметр | Значение |
|---|---|
| Версия | 25.8 LTS |
Trino и Hive Metastore
Поставляются как Docker-образы. При использовании собственного кластера Trino необходимо установить плагины платформы (functions, metrics), которые мы предоставляем, и соблюдать требования ниже.
Trino
| Параметр | Значение |
|---|---|
| Версия | 461 |
Hive Metastore
| Параметр | З начение |
|---|---|
| Версия | 3.1.3 |
S3
S3-совместимое объектное хранилище. В Kubernetes-кластере необходим S3 CSI driver для монтирования бакетов как файловую систему.
Используемые бакеты
| Бакет | Назначение |
|---|---|
trisigma-analytic-uploads | Iceberg/Hive-данные A/B-результатов |
trisigma-configurator-attachments | Пользовательские вложения в Trisigma |
trisigma-airflow-configs | DAG-конфиги Airflow |
trisigma-airflow-logs | Логи задач Airflow |
Если ваш S3-провайдер требует уникальное название бакета
Добавьте к именам случайный суффикс:
SUFFIX="$(openssl rand -hex 3)"
for s in analytic-uploads configurator-attachments airflow-configs airflow-logs; do
echo "trisigma-${s}-${SUFFIX}"
done