Глоссарий

Бандл

Бандл (bundle) — объект поставки в ADCM, призванный облегчить установку и развертывание продуктов. Это архив, содержащий пакеты программного обеспечения, шаблоны конфигурационных файлов и задачи Ansible, которые определяют операции, выполняемые в целевой системе.

Внешняя таблица

Внешняя таблица (external table) — это таблица, которая ссылается на данные, хранящиеся вне ADB. Вы можете выполнять SQL-запросы к внешней таблице таким же образом, как к любой другой таблице в базе. Внешние таблицы используют протокол, определяющий параметры подключения к источнику данных. Встроенные протоколы включают FILE, GPFDIST и HTTP.

Зеркальный сегмент

Зеркальный сегмент (mirror segment) — это узел, который обеспечивает отказоустойчивость для основных сегментов. Если основной сегмент становится недоступен, система автоматически переключается на его зеркальную копию.

Дифференциальный бэкап

Дифференциальный бэкап (differential backup) — тип бэкапа, при котором в бэкап помещаются только те файлы базы данных, которые изменились после запуска последнего полного бэкапа.

Интерконнект

Интерконнект — сеть, по которой выполняется перемещение данных между мастер-узлом и сегментами.

Инкрементальный бэкап

Инкрементальный бэкап (incremental backup, также известный как инкрементный бэкап) — тип бэкапа, при котором в бэкап помещаются только файлы, изменившиеся с момента запуска последнего бэкапа любого типа (полного, дифференциального либо инкрементного).

Кластер

Кластер (cluster) — система из взаимосвязанных узлов, включающая ведущий узел (master node) и несколько узлов-сегментов (segment node), которые обрабатывают данные параллельно. Каждый узел основан на экземпляре СУБД PostgreSQL.

Кластер мониторинга

Кластер мониторинга (monitoring cluster) — это набор сервисов (Diamond, Graphite и Grafana), которые осуществляют мониторинг кластера. Для интеграции с кластером мониторинга сервис Monitoring Clients должен быть установлен в кластерах, требующих мониторинга.

Коннектор

Коннектор (connector) — компонент, который обеспечивает обмен данными между ADB и внешними источниками. Например, ADB ClickHouse Connector, ADB to Kafka Connector и Kafka to ADB Connector.

Конфигурация резервного копирования

Конфигурация резервного копирования (backup configuration) — набор опций в Arenadata DB Backup Manager (ADBM), который определяет, как управлять бинарными бэкапами ADB: где их хранить, какой тип сжатия использовать и т.д.

Мастер

Мастер (master) — узел, который является точкой входа в базу данных и координирует работу сегментов. Конечные пользователи подключаются к нему для выполнения запросов.

Обертка сторонних данных

Обертка сторонних данных (Foreign Data Wrapper, FDW) — библиотека, которая используется сторонней таблицей (foreign table) для взаимодействия с удаленным источником данных.

Основной сегмент

Основной сегмент (primary segment) — активный узел, который хранит данные, получает планы запросов и выполняет их.

Партиционирование

Партиционирование (partitioning) — это способ повышения производительности запросов за счет логического разбиения больших таблиц на небольшие части, называемые партициями.

Полный бэкап

Полный бэкап (full backup) — тип бэкапа, при котором все содержимое базы данных помещается в бэкап.

Распределение данных

Распределение данных (distribution) — это механизм распределения строк таблицы по нескольким сегментам в архитектуре с параллельной обработкой данных. Каждая таблица в ADB имеет политику распределения.

Резервный мастер

Резервный мастер (standby master) — это компонент, который служит теплым резервом для основного мастера. Для поддержания синхронизации с основным мастером он использует записи WAL (write-ahead logging).

Сегмент

Сегмент (segment) — экземпляр базы данных PostgreSQL, который хранит и обрабатывает свой собственный набор данных.

Сервис

Модуль программного обеспечения, который предоставляет определенную функциональность. Примеры сервисов в кластере ADB: ADB, ADBM, ADB Control, сервисы коннекторов.

Сопоставление пользователя

Сопоставление пользователя (user mapping) — конфигурация, которая связывает локального пользователя базы данных с пользователем во внешней базе данных для предоставления доступа к ней. Сопоставление пользователя требуется для использования оберток сторонних данных (Foreign Data Wrapper, FDW).

Сторонняя таблица

Сторонняя таблица (foreign table) — это таблица, которая позволяет получать доступ к данным, находящимся за пределами базы данных. Сторонние таблицы используют сторонние серверы (foreign server) для представления удаленных баз данных и обертки сторонних данных (Foreign Data Wrapper, FDW) для взаимодействия с удаленным источником данных.

Табличное пространство

Табличное пространство (tablespace) — логическое имя для физического каталога в файловой системе, где база данных может хранить свои файлы данных (такие как таблицы и индексы). Табличное пространство позволяет оптимизировать производительность, размещая часто используемые данные на высокоскоростных носителях, в то время как исторические или менее важные данные хранятся на носителях более низкого класса.

Транзакция

Транзакция (transaction) — логическая единица, которая группирует одно или несколько SQL-выражений. Эти выражения затем рассматриваются как единая операция: либо все они выполняются успешно, либо ни одно из них. Отслеживать транзакции можно на странице Monitoring в ADB Control.

ADB

Arenadata DB (ADB) — это распределенная аналитическая СУБД, построенная на базе MPP-системы с открытым исходным кодом Greengage DB.

ADB Control

Arenadata DB Control (ADB Control) — это система мониторинга запросов Arenadata DB в режиме реального времени.

ADBM

Arenadata DB Backup Manager (ADBM) — это построенная на основе pgbackrest отказоустойчивая система для управления бинарными бэкапами ADB.

Append-optimized table

Тип таблиц, в которых данные оптимизированы для массовой загрузки. Такие таблицы подходят для нагрузок online analytical processing (OLAP).

Data flow

В ADBM поток данных — это процесс перемещения резервных копий между исходным и целевым кластером для реализации сценария disaster recovery (DR). Конфигурацию потока данных можно создать в ADBM с помощью параметров бэкапа и восстановления, таких как тип восстановления (Copy или Streaming) и точки восстановления.

Enterprise Tools

Arenadata Enterprise Tools (ET) — это решение, предоставляющее инфраструктуру для развертывания продуктов Arenadata в среде с ограниченным доступом в интернет.

GUC

Grand unified configuration (GUC) — это набор параметров конфигурации сервера, которые позволяют администраторам ADB управлять состоянием и конфигурацией СУБД.

Heap table

Тип таблиц, в которых данные хранятся в неотсортированной коллекции. Такие таблицы подходят для рабочих нагрузок online transaction processing (OLTP).

PXF

Greenplum Platform Extension Framework (PXF) — библиотека, которая позволяет ADB получать данные из внешних источников. PXF включает встроенные коннекторы (например, для доступа к HDFS, Hive и HBase). Пользователи также могут создавать свои собственные коннекторы. В ADB PXF представлен в виде сервиса, которым можно управлять с помощью веб-интерфейса ADCM.

Restore point

В ADBM restore point — это именованная точка восстановления, которая является минимальной единицей гранулярности согласования данных в кластере ADB.

Timeline

Механизм, используемый в ADBM для того, чтобы отличать серии WAL, сгенерированные после восстановления БД на определенный момент времени, от тех, которые были созданы до применения восстановления.

WAL

Write-ahead logging (WAL) — это метод обеспечения целостности данных с помощью записи всех изменений базы данных в постоянный дополняемый журнал перед обновлением соответствующих страниц данных на диске. WAL играет важную роль в механизме point-in-time recovery (PITR), используемом в ADBM.

Нашли ошибку? Выделите текст и нажмите Ctrl+Enter чтобы сообщить о ней