Обзор ADQM Control

Содержание

Функции

Arenadata QuickMarts Control (ADQM Control) — observability-платформа кластеров Arenadata QuickMarts (ADQM), которая позволяет существенно упростить администрирование и оптимизировать работу баз данных ADQM.

Основные функциональные возможности ADQM Control:

  • Мониторинг состояния кластера ADQM. ADQM Control может работать с несколькими кластерами ADQM одновременно.

  • Сбор и анализ системных метрик и сервисных метрик ADQM.

  • Heat map — визуальное представление состояния хостов кластера ADQM.

  • Генерирование оповещений (alerts). Оповещение — сообщение о проблеме, обнаруженной в кластере ADQM, с рекомендациями по ее устранению. ADQM Control группирует оповещения по триггерам, которые их вызывают:

    • оповещения на основе пороговых значений (генерируются, когда какой-либо показатель в системе достигает установленного порога);

    • оповещения на основе событий (генерируются, когда в системе происходит какое-либо событие).

    В пользовательском интерфейсе ADQM Control можно указать критерии создания различных типов оповещений (например, настроить пороговые значения, установить тайм-ауты) или отключить отслеживание определенных событий.

ПРИМЕЧАНИЕ
Перед использованием ADQM Control требуется полностью развернуть кластер ADQM и установить в нем сервис мониторинга.

Архитектура

Обобщенно архитектура ADQM Control представлена на схеме ниже.

Архитектура ADQM Control
Архитектура ADQM Control
Архитектура ADQM Control
Архитектура ADQM Control

Компоненты архитектуры ADQM Control на схеме:

  • ADQM Control — основной сервис, обеспечивающий полную функциональность ADQM Control. Включает следующие компоненты:

    • Agents. Сервис Alert Generator считывает метрики с сервера Prometheus кластера ADQM, генерирует оповещения при необходимости (учитываются указанные в настройках ADQM Control критерии и частота создания оповещений), отправляет оповещения в Alert Manager.

    • Alert Manager. Сервис Prometheus Alert Manager обрабатывает полученные от Alert Generator оповещения (фильтрует оповещения, отключает оповещения определенного типа, добавляет дополнительные метки) и направляет обработаные оповещения в Alert Receiver.

    • Alert Receiver. Сервис Alert Receiver получает обработанные оповещения от Alert Manager и записывает их в базу данных оповещений (alert storage).

    • Backend. Сервис Backend обеспечивает взаимодействие с web-интерфейсом ADQM Control (на схеме — Frontend) через REST API — обрабатывает полученные через web-интерфейс пользовательские запросы, сохраняет указанные настройки ADQM Control в ZooKeeper, получает оповещения из базы данных оповещений и передает их в web-интерфейс.

    В состав компонентов Agents и Alert Receiver входит также сервис conf.d, который следит за настройками оповещений, хранящимися в ZooKeeper — в случае их изменения обновляет конфигурационный файл сервиса Alert Generator/Alert Receiver и перезапускает сервис.

  • ZooKeeper — сервис-координатор ZooKeeper для хранения настроек ADQM Control, указанных пользователем. Чтобы сконфигурировать ZooKeeper для ADQM Control, можно:

  • Alert storage — база данных PostgreSQL для хранения оповещений, которую можно определить одним из следующих способов:

Нашли ошибку? Выделите текст и нажмите Ctrl+Enter чтобы сообщить о ней