Airflow
ETL-оркестратор платформы.
Назначение
Airflow — ETL-оркестратор платформы. Выполняет запланированные аналитические вычисления через Trino по конфигурациям, которые генерирует Configurator.
Компоненты Airflow:
- Webserver — веб-интерфейс
- Scheduler — планировщик DAG-ов
- Worker(ы) — исполнители задач (Celery)
- Configs Uploader — приём DAG-конфигов от Configurator и загрузка в S3
Деплой
Для установки необходимо заполнить файл с параметрами values-trisigma.yaml.
примечание
values.yaml содержит значения по умолчанию — не изменяйте его напрямую, а переопределяйте нужные параметры в отдельных файлах.
Параметры приложения
Хранятся в values-trisigma.yaml. Создайте файл из примера: cp values-trisigma.yaml.example values-trisigma.yaml.
Образы сервисов
| Параметр | Описание |
|---|---|
image.repository | Образ configs-uploader в Container registry |
airflow.images.airflow.repository | Образ Airflow в Container registry |
warning
registry.trisigma.io напрямуюОбразы необходимо предварительно зеркалировать в ваш собственный Container Registry.