Обзор ADQM Control
Функции
Arenadata QuickMarts Control (ADQM Control) — observability-платформа кластеров Arenadata QuickMarts (ADQM), которая позволяет существенно упростить администрирование и оптимизировать работу баз данных ADQM.
Основные функциональные возможности ADQM Control:
-
Мониторинг состояния кластера ADQM. ADQM Control может работать с несколькими кластерами ADQM одновременно.
-
Сбор и анализ системных метрик и сервисных метрик ADQM.
-
Heat map — визуальное представление состояния хостов кластера ADQM.
-
Генерирование оповещений (alerts). Оповещение — сообщение о проблеме, обнаруженной в кластере ADQM, с рекомендациями по ее устранению. ADQM Control группирует оповещения по триггерам, которые их вызывают:
-
оповещения на основе пороговых значений (генерируются, когда какой-либо показатель в системе достигает установленного порога);
-
оповещения на основе событий (генерируются, когда в системе происходит какое-либо событие).
В пользовательском интерфейсе ADQM Control можно указать критерии создания различных типов оповещений (например, настроить пороговые значения, установить тайм-ауты) или отключить отслеживание определенных событий.
-
ПРИМЕЧАНИЕ
Перед использованием ADQM Control требуется полностью развернуть кластер ADQM и установить в нем сервис мониторинга.
|
Архитектура
Обобщенно архитектура ADQM Control представлена на схеме ниже.
Компоненты архитектуры ADQM Control на схеме:
-
ADQM Control — основной сервис, обеспечивающий полную функциональность ADQM Control. Включает следующие компоненты:
-
Agents. Сервис Alert Generator считывает метрики с сервера Prometheus кластера ADQM, генерирует оповещения при необходимости (учитываются указанные в настройках ADQM Control критерии и частота создания оповещений), отправляет оповещения в Alert Manager.
-
Alert Manager. Сервис Prometheus Alert Manager обрабатывает полученные от Alert Generator оповещения (фильтрует оповещения, отключает оповещения определенного типа, добавляет дополнительные метки) и направляет обработаные оповещения в Alert Receiver.
-
Alert Receiver. Сервис Alert Receiver получает обработанные оповещения от Alert Manager и записывает их в базу данных оповещений (alert storage).
-
Backend. Сервис Backend обеспечивает взаимодействие с web-интерфейсом ADQM Control (на схеме — Frontend) через REST API — обрабатывает полученные через web-интерфейс пользовательские запросы, сохраняет указанные настройки ADQM Control в ZooKeeper, получает оповещения из базы данных оповещений и передает их в web-интерфейс.
В состав компонентов Agents и Alert Receiver входит также сервис conf.d, который следит за настройками оповещений, хранящимися в ZooKeeper — в случае их изменения обновляет конфигурационный файл сервиса Alert Generator/Alert Receiver и перезапускает сервис.
-
-
ZooKeeper — сервис-координатор ZooKeeper для хранения настроек ADQM Control, указанных пользователем. Чтобы сконфигурировать ZooKeeper для ADQM Control, можно:
-
установить сервис Zookeeper в кластере ADQM Control;
-
указать внешний кластер ZooKeeper.
-
-
Alert storage — база данных PostgreSQL для хранения оповещений, которую можно определить одним из следующих способов:
-
установить сервис Arenadata PostgreSQL в кластере ADQM Control;
-
указать внешний кластер PostgreSQL в настройках ADQM Control.
-