Обзор веб-интерфейсов Impala
У каждого из демонов Impala (impalad, statestored и catalogd) есть встроенный веб-сервер, который отображает диагностическую информацию и информацию о состоянии демона. Ссылки на веб-интерфейсы можно найти на вкладке Info сервиса Impala в пользовательском интерфейсе ADCM.
URL-адрес имеет следующую форму: http://<server‑hostname>:<port>/
.
Пример: http://adh-host1.ru-central1.internal:25000/
.
Для защищённых кластеров используйте https://
вместо http://
.
Порты веб-серверов, используемые по умолчанию, перечислены в таблице ниже.
Компонент | Демон | Порт |
---|---|---|
Impala Daemon |
impalad |
25000 |
Impala Statestore |
statestored |
25010 |
Impala Catalog Service |
catalogd |
25020 |
Чтобы изменить порт веб-сервера, откройте вкладку Primary Configuration соответствующего компонента Impala и установите параметр webserver_port. Чтобы отключить веб-интерфейс, снимите флажок enable_webserver и перезапустите требуемый компонент с помощью действия компонента Restart Impala Daemon, или Restart Impala Statestore, или Restart Impala Catalog.
Веб-интерфейсы Impala поддерживают SPNEGO, чтобы обеспечить защиту по протоколу Kerberos. SPNEGO передает токены согласования через заголовки HTTP для защиты HTTP-запросов с помощью Kerberos. Чтобы включить авторизацию с помощью SPNEGO, установите флажок webserver_require_spnego (на вкладке компонента Primary Configuration в интерфейсе ADCM) для каждого компонента, который должен использовать SPNEGO.
Вы можете использовать меню в верхней части веб-интерфейсов для навигации по страницам, описанным ниже. Также можно добавить слеш (/
) и имя страницы (например, /memz
) к HTTP-адресу в браузере, чтобы на неё перейти.
Веб-интерфейс Impala Daemon (impalad)
Веб-интерфейс impalad содержит информацию о параметрах конфигурации, выполняемых и завершенных запросах, а также о производительности и использовании ресурсов.
Каждый хост impalad имеет собственный экземпляр веб-интерфейса с подробной информацией о запросах, для которых этот хост был координатором. Для исследования проблемных запросов необходимо выбрать ноду, которая была для них координатором.
Главная страница веб-интерфейса impalad содержит следующую информацию об impalad:
-
Version — версия демона и информация о том, когда была собрана Impala и какие флаги сборки использовались.
-
Process start time — время запуска демона.
-
Hardware info — информация об оборудовании хоста.
-
OS information — информация об операционной системе, которая установлена на хосте.
-
Process information — информация о процессе демона.
-
CGroup information — информация о настройках CGroup.
На странице Admission Controller перечислены все пулы ресурсов, в которые запросы были отправлены хотя бы один раз, а также их состояние и статистика.
На странице представлена следующая информация о каждом пуле ресурсов:
-
Время, прошедшее с того момента, как statestored получил последнее обновление.
-
Предупреждение, если этот impalad отключен от statestored и информация на странице может быть устаревшей.
-
Конфигурация пула.
-
Запросы в очереди, отправленные этому координатору, в порядке отправки.
-
Выполняемые запросы этого координатора.
-
Статистика пула. Время в очереди рассчитывается как экспоненциальное скользящее среднее, которое представляет собой среднее время в очереди последних 10–12 запросов. Если запрос принимается немедленно, это среднее время рассчитывается с использованием времени ожидания
0
. -
Гистограмма пикового распределения памяти. Она учитывает память, используемую запросами, допущенными к пулу. На гистограмме отображаются данные для всех запросов, допущенных в пул, включая завершенные, отмененные и закончившиеся неудачей.
Вы можете кликнуть Reset informational stats, чтобы обнулить статистические данные, в том числе итоговую статистику, время в очереди и гистограмму для определенного пула или нажать Reset informational stats for all pulls, чтобы очистить статистику для всех пулов сразу.
Статистика Admission Controller также доступна в виде объекта JSON из следующей конечной точки HTTP (HTTP endpoint): http://<server‑hostname>:<port>/admission?json
. Пример: /http://adh-host1.ru-central1.internal:25000/admission?json
. За дополнительной информацией обратитесь к статье Admission Control and Query Queuing.
На этой странице приведена следующая информация для каждого из узлов impalad в кластере:
-
Address — адрес ноды (имя хоста и порт).
-
KRPC Address — KRPC-адрес ноды. Может быть использован в команде
SHUTDOWN
. -
Backend Id.
-
Coordinator — логическое значение, показывающее, является ли нода координатором.
-
Executor — логическое значение, показывающее, является ли нода исполнителем запросов.
-
Memory Limit for Admission — объем памяти, который выделен контроллером допуска этой ноде.
-
Memory Reserved — объем памяти, зарезервированный для запросов на этой ноде.
-
Memory Admitted by Queries Submitted to this Coordinator — память, необходимая для запросов, обрабатываемых этим координатором.
-
Admission Control Slots In Use — количество используемых слотов контроллера доступа.
-
Num. Queries Admitted by this Coordinator — количество запросов, обрабатываемых текущим координатором.
-
Executor Groups.
Если в кластере есть какой-либо остановленный демон impalad, ноды разбиваются на две таблицы: Active backend(s) и Quiescing backend(s).
Поскольку каждый демон impalad знает о других демонах impalad через Statestore, все веб-серверы impalad должны отображать одну и ту же информацию.
На странице Catalog отображается список баз данных и связанных с ними таблиц. Вы можете использовать эту страницу, чтобы определить, какая база данных включает определённую таблицу, проверить правильность написания имени базы данных или таблицы, найти одинаковые имена таблиц в нескольких базах данных. Основным сценарием использования этой страницы при отладке является проверка того, знает ли экземпляр impalad о таблице, которая находится в определенной базе данных.
На этой странице отображаются общие параметры конфигурации Hadoop, с которыми работает Impala.
На этой странице отображается информация мониторинга о различных подсистемах JVM в формате JSON, например, o пулах памяти, управлении потоками, времени выполнения и других.
На этой странице отображаются текущие уровни важности сообщений, попадающих в логи Java и серверной части демона. Также страница позволяет динамически изменять уровни логирования без перезапуска демона.
Страница отображает последние записи из лог-файла impalad.INFO,
включающего сообщения с уровнем info
, warning
и error
. Позволяет просмотреть сведения о последних операциях, чтобы определить, были ли операции успешными или возникли ошибки.
Эта страница позволяет избежать поиска лог-файлов в файловой системе.
На этой странице отображается сводная и подробная информация об использовании памяти демоном impalad.
На странице отображается текущий набор метрик, счетчиков и флагов, представляющих различные аспекты внутренних операций демона.
На странице перечислены счетчики оператора PROFILE
.
Страница содержит следующие таблицы:
-
Queries in flight — выполняемые запросы.
-
Waiting to be closed — запросы, которые закончили выполнять действия, но еще не были завершены.
-
Last 100 completed queries — последние завершенные запросы. Вы можете управлять количеством запросов и, следовательно, объемом памяти, выделенной для хранения информации о завершенных запросах, используя параметр запуска
--query_log_size
для impalad. -
Query Locations — отображает, как запущенные запросы распределяются между хостами impalad.
Запросы перечислены в обратном хронологическом порядке, самые последние находятся вверху таблицы.
Ссылка Details для каждого запроса отображает альтернативные представления запроса, включая графическое представление плана и вывод операторов EXPLAIN
, SUMMARY
и PROFILE
из impala-shell. На вкладке Profile страницы Details можно экспортировать выходные данные в Thrift, JSON или текстовый формат.
На странице отображается информация о продолжительности RPC-соединений демона с другими демонами Impala.
На странице отображается информация о сессиях, подключенных к этому экземпляру impalad. Например, сессии могут включать соединения из impala-shell или JDBC.
Страница отображает информацию о потоках (threads), используемых демоном, и о категориях, в которые они сгруппированы.
Страница отображает параметры конфигурации, которые используются, когда этот демон взаимодействует с другими компонентами Hadoop, такими как HDFS и YARN. Параметры собираются из конфигурационных файлов.
На странице представлены метрики в формате Prometheus. Prometheus может использовать эти данные для мониторинга и оповещения.
Меню не содержит опции /metrics_prometheus
. Чтобы отобразить эту страницу, добавьте /metrics_prometheus
к HTTP-адресу в браузере.
Веб-интерфейс Impala Statestore (statestored)
Веб-интерфейс statestored включает информацию об использовании памяти, параметрах конфигурации и текущих проверках работоспособности. Поскольку в кластере есть только одна нода с statestored, вы можете получить доступ к веб-интерфейсу statestored только на хосте с компонентом Impala Statestore.
Главная страница веб-интерфейса statestored содержит следующую информацию о statestored:
-
Version — версия демона и информация о том, когда была собрана Impala и какие флаги сборки использовались.
-
Process start time — время запуска демона.
-
Hardware info — информация об оборудовании хоста.
-
OS information — информация об операционной системе, которая установлена на хосте.
-
Process information — информация о процессе демона.
-
CGroup information — информация о настройках CGroup.
На этой странице отображаются текущие уровни важности сообщений, попадающих в логи Java и серверной части демона. Также страница позволяет динамически изменять уровни логирования без перезапуска демона.
Страница отображает последние записи из лог-файла statestored.INFO,
включающего сообщения с уровнем info
, warning
и error
. Позволяет просмотреть сведения о последних операциях, чтобы определить, были ли операции успешными или возникли ошибки.
Эта страница позволяет избежать поиска лог-файлов в файловой системе.
На этой странице отображается сводная и подробная информация об использовании памяти демоном statestored.
На странице отображается текущий набор метрик, счетчиков и флагов, представляющих различные аспекты внутренних операций демона.
На странице перечислены счетчики оператора PROFILE
.
На странице отображается информация о продолжительности RPC-соединений демона с другими демонами Impala.
На странице отображается информация о демонах Impala, зарегистрированных в statestored для получения и отправки обновлений.
Страница отображает информацию о потоках (threads), используемых демоном, и о категориях, в которые они сгруппированы.
На странице отображается информация о разделах метаданных (topics), на которые подписаны другие демоны Impala для получения обновлений.
Страница отображает параметры конфигурации, которые используются, когда этот демон взаимодействует с другими компонентами Hadoop, такими как HDFS и YARN. Параметры собираются из конфигурационных файлов.
На странице представлены метрики в формате Prometheus. Prometheus может использовать эти данные для мониторинга и оповещения.
Меню не содержит опции /metrics_prometheus
. Чтобы отобразить эту страницу, добавьте /metrics_prometheus
к HTTP-адресу в браузере.
Веб-интерфейс Impala Catalog Service (catalogd)
Веб-интерфейс catalogd включает информацию о базах данных, таблицах и других объектах, которыми управляет Impala, в дополнение к использованию ресурсов и параметрам конфигурации catalogd. Поскольку в кластере есть только одна нода с catalogd, вы можете получить доступ к веб-интерфейсу catalogd только на хосте с компонентом Impala Catalog Service.
Главная страница веб-интерфейса catalogd содержит следующую информацию о catalogd:
-
Version — версия демона и информация о том, когда была собрана Impala и какие флаги сборки использовались.
-
Process start time — время запуска демона.
-
Hardware info — информация об оборудовании хоста.
-
OS information — информация об операционной системе, которая установлена на хосте.
-
Process information — информация о процессе демона.
-
CGroup information — информация о настройках CGroup.
На странице Catalog отображается список баз данных и связанных с ними таблиц. Вы можете использовать эту страницу, чтобы определить, какая база данных включает определённую таблицу, проверить правильность написания имени базы данных или таблицы, найти одинаковые имена таблиц в нескольких базах данных. Основным сценарием использования этой страницы при отладке является проверка того, знает ли экземпляр impalad о таблице, которая находится в определенной базе данных.
Помимо данных, которые есть на странице catalog демона impalad, эта страница содержит списки таблиц с самыми высокими требованиями к памяти, с наибольшим количеством операций с метаданными, с наибольшим количеством файлов и с наибольшим временем загрузки метаданных.
На этой странице отображается информация мониторинга о различных подсистемах JVM в формате JSON, например, o пулах памяти, управлении потоками, времени выполнения и других.
На этой странице отображаются текущие уровни важности сообщений, попадающих в логи Java и серверной части демона. Также страница позволяет динамически изменять уровни логирования без перезапуска демона.
Страница отображает последние записи из лог-файла catalogd.INFO,
включающего сообщения с уровнем info
, warning
и error
. Позволяет просмотреть сведения о последних операциях, чтобы определить, были ли операции успешными или возникли ошибки.
Эта страница позволяет избежать поиска лог-файлов в файловой системе.
На этой странице отображается сводная и подробная информация об использовании памяти демоном catalogd.
На странице отображается текущий набор метрик, счетчиков и флагов, представляющих различные аспекты внутренних операций демона.
На странице отображается информация об операциях catalogd.
На странице перечислены счетчики оператора PROFILE
.
На странице отображается информация о продолжительности RPC-соединений демона с другими демонами Impala.
Страница отображает информацию о потоках (threads), используемых демоном, и о категориях, в которые они сгруппированы.
Страница отображает параметры конфигурации, которые используются, когда этот демон взаимодействует с другими компонентами Hadoop, такими как HDFS и YARN. Параметры собираются из конфигурационных файлов.
На странице представлены метрики в формате Prometheus. Prometheus может использовать эти данные для мониторинга и оповещения.
Меню не содержит опции /metrics_prometheus
. Чтобы отобразить эту страницу, добавьте /metrics_prometheus
к HTTP-адресу в браузере.